Gene EcSMS35_1241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1241
Symbol	fliK
ID	6146390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1239857
End bp	1240984
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	55%
IMG OID	641616119
Product	flagellar hook-length control protein
Protein accession	YP_001743302
Protein GI	170682141
COG category	[N] Cell motility
COG ID	[COG3144] Flagellar hook-length control protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.896281
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCGCT TAGCGCCCTT AATTACCGCC GACGTTGACA CCACCACATT GCCTGGCGGC 
AAAGCCAGCG ATGCTGCACA AGATTTTCTC GCGTTGTTGA GCGAAGCATT AGCAGGCGAG 
ACAACTACCG ACAAAGCGGC CCCCCAGTTG CTGGTGGCAA CAGATAAGCC CACGACAAAA 
GGCGAGCCGC TGGTCAGCGA GATTCTTGCC GATGCGCAAC AAGCGGATTT ACTGATCCCT 
GTGGATGAAA CACCGCCTGT CATCAACGAC GAACAATCCA CATCAACACC ATTAACCACC 
GCTCAAACGA TGACGTTGGC TGCGGTGGCT GGCAACAATA CGGCAAAAGA CGAAAAAGCG 
GATGATCTGA ATGAAGACGT CACCGCAAGC CTGAGCGCCC TTTTTGCGAT GTTGCCGGGT 
TTTGACAATA CGCCCAAAGT GACTGATGCG CCGTCAACCG TGTTACCGAC AGAGAAACCA 
ACGCTCTTCA CAAAACTGAC TTCTGAGCAA CTCACAACAG CACAGCCTGA TGACGCCCCC 
GGCACACCAG CTCAGCCATT AACACCGCTG GTAGCAGAAG CCCAGAGTAA AGCGGAAGTC 
ATCAGCACAC CTTCACCGGT GACCGCTGCC GCCAGCCCGC TAATCACTCC ACACCAGACA 
CAGCCACTGC CCACCGTCGC CGCACCTGTT TTGAGTGCAC CGCTGGGTTC TCACGAATGG 
CAACAATCAT TAAGCCAGCA TATTTCGCTG TTCACCCGCC AGGGGCAACA AAGTGCAGAG 
TTGCGACTGC ACCCACAGGA TTTAGGTGAA GTGCAAATCT CCCTCAAAGT GGATGATAAC 
CAGGCTCAAA TCCAGATGGT TTCACCGCAT CAGCATGTAC GCGCCGCCCT GGAAGCAGCG 
CTGCCGGTAC TGCGTACGCA GCTGGCCGAA AGTGGCATTC AGTTAGGGCA AAGCAACATC 
AGTGGCGAAA GCTTTAGTGG TCAGCAGCAG GCCGCTTCCC AACAACAGCA AAGCCAACGC 
ACAGTAAACC ATGAACCTCT GGCGGGGGAA GACGACGATA CGCTTCCGGT TCCCGTCTCT 
TTACAAGGGC GCGTAACAGG CAACAGCGGC GTTGATATTT TCGCCTAA

Protein sequence

MIRLAPLITA DVDTTTLPGG KASDAAQDFL ALLSEALAGE TTTDKAAPQL LVATDKPTTK 
GEPLVSEILA DAQQADLLIP VDETPPVIND EQSTSTPLTT AQTMTLAAVA GNNTAKDEKA 
DDLNEDVTAS LSALFAMLPG FDNTPKVTDA PSTVLPTEKP TLFTKLTSEQ LTTAQPDDAP 
GTPAQPLTPL VAEAQSKAEV ISTPSPVTAA ASPLITPHQT QPLPTVAAPV LSAPLGSHEW 
QQSLSQHISL FTRQGQQSAE LRLHPQDLGE VQISLKVDDN QAQIQMVSPH QHVRAALEAA 
LPVLRTQLAE SGIQLGQSNI SGESFSGQQQ AASQQQQSQR TVNHEPLAGE DDDTLPVPVS 
LQGRVTGNSG VDIFA