Gene ECH74115_0842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0842
Symbol	tolA
ID	6972034
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	864119
End bp	865393
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	52%
IMG OID	643384867
Product	cell envelope integrity inner membrane protein TolA
Protein accession	YP_002269373
Protein GI	209400066
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3064] Membrane protein involved in colicin uptake
TIGRFAM ID	[TIGR01352] TonB family C-terminal domain [TIGR02794] TolA protein

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000389137
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCAAAGG CAACCGAACA AAACGACAAG CTCAAGCGGG CGATAATTAT TTCAGCAGTG 
CTGCATGTCA TCTTATTTGC GGCGCTGATC TGGAGTTCGT TCGATGAGAA TATAGAAGCT 
TCAGCTGGAG GCGGCGGTGG TTCGTCCATC GACGCTGTCA TGGTTGATTC AGGTGCGGTA 
GTTGAGCAGT ACAAACGCAT GCAAAGCCAG GAATCAAGCG CGAAGCGTTC TGATGAGCAG 
CGCAAGATGA AGGAACAGCA GGCTGCTGAA GAACTGCGTG AGAAACAAGC GGCTGAACAG 
GAACGCCTGA AGCAACTTGA GAAAGAGCGG TTAGCTGCTC AGGAACAGAA AAAGCAGGCT 
GAAGAAGCCG CAAAACAGGC CGAGTTAAAG CAGAAGCAAG CGGAAGAGGC GGCAGCGAAA 
GCGGCGGCAG ATGCTAAAGC GAAGGCCGAA GCGGATGATA AAGCTGCGGA AGAAGCAGCG 
AAGAAAGCGG CTGCAGACGC GAAGAAAAAA GCAGAAGCAG AAGCCGCCAA AGCCGCAGCC 
GAAGCGCAGA AAAAAGCCGA GGCAGCAGCT GCGGCGCTGA AGAAGAAAGC GGAAGCGGCA 
GAAGCAGCTG CAGCTGAAGC AAGAAAGAAA GCGGCAGCAG AGAAAGCTGC AGCCGACAAA 
AAAGCAGCAG AGAAAGCTGC AGCCGACAAA AAAGCAGCAG AAAAAGCGGC TGCTGAAAAG 
GCAGCAGCAG AGAAAGCTGC AGCCGACAAA AAAGCAGCAG AAAAAGCGGC TGCTGAAAAG 
GCAGCAGCTG ATAAGAAAGC AGCGGCAGAA AAAGCCGCCG CAGACAAAAA AGCGGCAGCT 
GCAAAAGCAG CAGCTGAAAA AGCCGCTGCA GCAAAAGCTG CCGCGGAGGC AGATGATATT 
TTCGGTGAGC TAAGCTCTGG TAAGAATGCA CCGAAAACGG GGGGAGGGGC GAAAGGGAAC 
AATGCTTCGC CTGCCGGGAG TGGTAATACT AAAAACAATG GCGCATCAGG GGCCGATATC 
AATAACTATG CCGGGCAGAT TAAATCTGCT ATCGAAAGTA AGTTCTATGA CGCATCGTCC 
TATGCAGGCA AAACCTGTAC GCTGCGCATA AAACTGGCAC CCGATGGTAT GTTACTGGAT 
ATCAAACCTG AAGGTGGCGA TCCCGCACTT TGTCAGGCTG CGTTGGCAGC AGCTAAACTT 
GCGAAGATCC CGAAACCACC AAGCCAGGCA GTATATGAAG TGTTCAAAAA CGCGCCATTG 
GACTTCAAAC CGTAA

Protein sequence

MSKATEQNDK LKRAIIISAV LHVILFAALI WSSFDENIEA SAGGGGGSSI DAVMVDSGAV 
VEQYKRMQSQ ESSAKRSDEQ RKMKEQQAAE ELREKQAAEQ ERLKQLEKER LAAQEQKKQA 
EEAAKQAELK QKQAEEAAAK AAADAKAKAE ADDKAAEEAA KKAAADAKKK AEAEAAKAAA 
EAQKKAEAAA AALKKKAEAA EAAAAEARKK AAAEKAAADK KAAEKAAADK KAAEKAAAEK 
AAAEKAAADK KAAEKAAAEK AAADKKAAAE KAAADKKAAA AKAAAEKAAA AKAAAEADDI 
FGELSSGKNA PKTGGGAKGN NASPAGSGNT KNNGASGADI NNYAGQIKSA IESKFYDASS 
YAGKTCTLRI KLAPDGMLLD IKPEGGDPAL CQAALAAAKL AKIPKPPSQA VYEVFKNAPL 
DFKP