Gene EcHS_A2043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2043
Symbol	fliK
ID	5593033
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2038126
End bp	2039253
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	55%
IMG OID	640921187
Product	flagellar hook-length control protein
Protein accession	YP_001458732
Protein GI	157161414
COG category	[N] Cell motility
COG ID	[COG3144] Flagellar hook-length control protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	0.436184
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCGCT TAGCGCCCTT GATTACCGCC GACGTTGACA CCACCACATT GTCTGGCGGC 
AAAGCCAGCG ATGCTGCACA AGATTTTCTC GCGTTGTTGA GCGAAGCATT AACAGGCGAG 
GCAACAACCG ACAAAGCGAC TCCCCAGTTG CTGGTGGCAA CAGATAAGCC CACGACAAAA 
GGCGAGCCGC TGGTCAGCGA TATTGTTTCC GACGCGCAAC AAGCGGATTT ACTGATCCCT 
GTGGATGAAA CACCGCCTGT CATCAACGAC GAACAATCCA CATCAACACC GTTAAACACC 
GCTCAGACGA TAACGTTGGC TGCGGCGGCT GACAACAATA CGGCAAAAGA CGAAAAAGCG 
GATGATCTGA ATGAAGACGT CACCGCCAGC CTGAGTGCCC TTTTTGCGAT GTTGCCGGGT 
TTTGACAATA CGCCCAAAGT GACTGATGCA CCGTCAACCG TATTACCGAC AGAGAAACCA 
ACGCTCTTCA CAAAACTGAC TTCTGCGCAA CTCACAACAG CACAGCCTGA TGACGCCCCC 
GGCACGCCAG CTCAGCCATT AACACCGCTG ATAGCAGAAG CCCAGAGTAA AGCGGAAATC 
ATCAGCACGC CTTCGCCGGT GACCGCTGCC GCCAGCCCGC TAATCACTCC ACACCAGACA 
CAGCCACTGC CCACCGTCGC CGCGCCTGTT TTGAGTGCAC CGCTGGGTTC TCACGAATGG 
CAACAATCAT TAAGCCAGCA TATTTCGCTG TTCACCCGCC AGGGGCAACA AAGTGCAGAG 
TTGCGTCTGC ACCCGCAGGA TTTAGGTGAG GTGCAAATCT CCCTCAAAGT GGATGATAAC 
CAGGCGCAAA TCCAGATGGT TTCACCGCAT CAGCATGTAC GCGCCGCCCT GGAAGCAGCG 
CTGCCGGTAC TGCGTACGCA GCTGGCCGAA AGTGGCATTC AGTTAGGGCA AAGCAACATC 
AGTGGCGAAA GCTTTAGTGG TCAGCAGCAG GCCGCTTCCC AACAACAGCA AAGCCAACGC 
ACAGTAAACC ATGAACCTCT GGCGGGGGAA GAAGACGATA CGCTTCCGGT TCCCGTCTCT 
TTACAAGGGC GCGTAACAGG CAACAGCGGC GTTGATATTT TCGCCTAA

Protein sequence

MIRLAPLITA DVDTTTLSGG KASDAAQDFL ALLSEALTGE ATTDKATPQL LVATDKPTTK 
GEPLVSDIVS DAQQADLLIP VDETPPVIND EQSTSTPLNT AQTITLAAAA DNNTAKDEKA 
DDLNEDVTAS LSALFAMLPG FDNTPKVTDA PSTVLPTEKP TLFTKLTSAQ LTTAQPDDAP 
GTPAQPLTPL IAEAQSKAEI ISTPSPVTAA ASPLITPHQT QPLPTVAAPV LSAPLGSHEW 
QQSLSQHISL FTRQGQQSAE LRLHPQDLGE VQISLKVDDN QAQIQMVSPH QHVRAALEAA 
LPVLRTQLAE SGIQLGQSNI SGESFSGQQQ AASQQQQSQR TVNHEPLAGE EDDTLPVPVS 
LQGRVTGNSG VDIFA