Gene EcolC_1699 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1699
Symbol
ID	6066712
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1897606
End bp	1898733
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	55%
IMG OID	641601113
Product	flagellar hook-length control protein
Protein accession	YP_001724678
Protein GI	170019724
COG category	[N] Cell motility
COG ID	[COG3144] Flagellar hook-length control protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0151155
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCGCT TAGCGCCCTT AATTACCGCC GACGTTGACA CCACCACATT GCCTGGCGGC 
AAAGCCAGCG ATGCTGCACA AGATTTTCTC GCGTTGTTGA GCGAAGCATT AGCAGGCGAG 
ACAACTACCG ACAAAGCGGC CCCCCAGTTG CTGGTGGCAA CAGATAAGCC CACGACAAAA 
GGCGAGCCGC TGGTCAGCGA GATTCTTGCC GATGCGCAAC AAGCGGATTT ACTGATCCCT 
GTGGATGAAA CACCGCCTGT CATCAACGAC GAACAATCCA CATCAACACC ATTAACCACC 
GCTCAAACGA TGACGATGGC TGCGGTGGCT GGCAACAATA CGGCAAAAGA CGAAAAAGCG 
GATGATCTGA ATGAAGACGT CACCGCAAGC CTGAGCGCCC TTTTTGCGAT GTTGCCGGGT 
TTTGACAATA CGCCCAAAGT GACTGATGTG CCGTCAACCG TGTTACCGGC AGAGAAACCA 
ACGCTATTCA CAAAACTGAC TTCTGCGCAA CTCACAACAG CACAGCCTGA TGATGCCCCC 
GGCACGCCAG CTCAGCCATT AACACCGCTG GTAGCAGAAG CCCAGAGTAA AGCGGAAGTC 
ATCAGCACAC CTTCACCGGT GACCGCTGCC GCCAGCCCGC TAATCACTCC ACACCAGACA 
CAGCCACTGC CCACCGTCGC CGCGCCTGTG TTGAGTGCAC CGCTGGGTTC TCACGAATGG 
CAACAATCAT TAAGCCAGCA TATTTCGCTG TTCACCCGCC AGGGGCAACA AAGTGCAGAG 
TTGCGTCTGC ACCCGCAGGA TTTAGGTGAA GTGCAAATCT CCCTCAAAGT GGATGATAAC 
CAGGCGCAAA TCCAGATGGT TTCACCGCAT CAACACGTAC GCGCCGCCCT GGAAGCAGCG 
CTTCCGGTAC TGCGAACGCA GCTGGCCGAA AGTGGCATTC AGTTAGGGCA AAGCAACATC 
AGTGGCGAAA GCTTTAGTGG TCAGCAGCAG GCCGCTTCCC AACAACAGCA AAGCCAACGC 
ACAGTAAACC ATGAACCTCT GGCGGGGGAA GACGACGATA CGCTTCCGGT TCCCGTCTCT 
TTACAAGGGC GTGTAACAGG CAACAGCGGC GTTGATATTT TCGCCTAA

Protein sequence

MIRLAPLITA DVDTTTLPGG KASDAAQDFL ALLSEALAGE TTTDKAAPQL LVATDKPTTK 
GEPLVSEILA DAQQADLLIP VDETPPVIND EQSTSTPLTT AQTMTMAAVA GNNTAKDEKA 
DDLNEDVTAS LSALFAMLPG FDNTPKVTDV PSTVLPAEKP TLFTKLTSAQ LTTAQPDDAP 
GTPAQPLTPL VAEAQSKAEV ISTPSPVTAA ASPLITPHQT QPLPTVAAPV LSAPLGSHEW 
QQSLSQHISL FTRQGQQSAE LRLHPQDLGE VQISLKVDDN QAQIQMVSPH QHVRAALEAA 
LPVLRTQLAE SGIQLGQSNI SGESFSGQQQ AASQQQQSQR TVNHEPLAGE DDDTLPVPVS 
LQGRVTGNSG VDIFA