Gene EcolC_2916 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2916
Symbol	tolA
ID	6065482
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3177707
End bp	3178978
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	52%
IMG OID	641602328
Product	cell envelope integrity inner membrane protein TolA
Protein accession	YP_001725870
Protein GI	170020916
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3064] Membrane protein involved in colicin uptake
TIGRFAM ID	[TIGR02794] TolA protein

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000145417
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.52602
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCAAAGG CAACCGAACA AAACGACAAG CTCAAGCGGG CGATAATTAT TTCAGCAGTG 
CTGCATGTCA TCTTATTTGC GGCGCTGATC TGGAGTTCGT TCGATGAGAA TATAGAAGCT 
TCAGCCGGAG GCGGCGGTGG TTCGTCCATC GACGCTGTCA TGGTTGATTC AGGTGCGGTA 
GTTGAGCAGT ACAAACGCAT GCAAAGCCAG GAATCAAGCG CGAAGCGTTC TGATGAACAG 
CGCAAGATGA AGGAACAGCA GGCTGCTGAA GAACTGCGTG AGAAACAAGC GGCTGAACAG 
GAACGCCTGA AGCAACTTGA GAAAGAGCGG TTAGCGGCTC AGGAGCAGAA AAAGCAGGCT 
GAAGAAGCCG CAAAACAGGC CGAGTTAAAG CAGAAGCAAG CTGAAGAGGC GGCAGCGAAA 
GCGGCGGCAG ATGCTAAAGC GAAGGCCGAA GCAGATGCTA AAGCTGCGGA AGAAGCAGCG 
AAGAAAGCGG CTGCAGACGC AAAGAAAAAA GCAGAAGCAG AAGCCGCCAA AGCCGCAGCC 
GAAGCGCAGA AAAAAGCCGA GGCAGCCGCT GCGGCACTGA AGAAGAAAGC GGAAGCGGCA 
GAAGCAGCTG CAGCTGCAGC TGAAGCAAGA AAGAAAGCGG CAACTGAAGC TGCTGAAAAA 
GCCAAAGCAG AAGCTGAGAA GAAAGCGGCT GCTGAAAAGG CTGCAGCTGA TAAGAAAGCG 
GCAGCAGAGA AAGCTGCAGC CGACAAAAAA GCAGCAGAAA AAGCGGCTGC TGAAAAGGCA 
GCAGCTGATA AGAAAGCAGC GGCAGAAAAA GCCGCCGCAG ACAAAAAAGC GGCAGCGGCA 
AAAGCTGCAG CTGAAAAAGC CGCTGCAGCA AAAGCGGCCG CAGAGGCAGA TGATATTTTC 
GGTGAGCTAA GCTCTGGTAA GAATGCACCG AAAACGGGGG GAGGGGCGAA AGGGAACAAT 
GCTTCGCCTG CCGGGAGTGG TAATACTAAA AACAATGGCG CATCAGGGGC CGATATCAAT 
AACTATGCCG GGCAGATTAA ATCTGCTATC GAAAGTAAGT TCTATGACGC ATCGTCCTAT 
GCAGGCAAAA CCTGTACGCT GCGCATAAAA CTGGCACCCG ATGGTATGTT ACTGGATATC 
AAACCTGAAG GTGGCGATCC CGCACTTTGT CAGGCTGCGT TGGCAGCAGC TAAACTTGCG 
AAGATCCCGA AACCACCAAG CCAGGCAGTA TATGAAGTGT TCAAAAACGC GCCATTGGAC 
TTCAAACCGT AA

Protein sequence

MSKATEQNDK LKRAIIISAV LHVILFAALI WSSFDENIEA SAGGGGGSSI DAVMVDSGAV 
VEQYKRMQSQ ESSAKRSDEQ RKMKEQQAAE ELREKQAAEQ ERLKQLEKER LAAQEQKKQA 
EEAAKQAELK QKQAEEAAAK AAADAKAKAE ADAKAAEEAA KKAAADAKKK AEAEAAKAAA 
EAQKKAEAAA AALKKKAEAA EAAAAAAEAR KKAATEAAEK AKAEAEKKAA AEKAAADKKA 
AAEKAAADKK AAEKAAAEKA AADKKAAAEK AAADKKAAAA KAAAEKAAAA KAAAEADDIF 
GELSSGKNAP KTGGGAKGNN ASPAGSGNTK NNGASGADIN NYAGQIKSAI ESKFYDASSY 
AGKTCTLRIK LAPDGMLLDI KPEGGDPALC QAALAAAKLA KIPKPPSQAV YEVFKNAPLD 
FKP