Gene EcolC_2226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2226
Symbol
ID	6066830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2445261
End bp	2446436
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	53%
IMG OID	641601632
Product	benzoate transporter
Protein accession	YP_001725191
Protein GI	170020237
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3135] Uncharacterized protein involved in benzoate metabolism
TIGRFAM ID	[TIGR00843] benzoate transporter

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.711061
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCTGT TTTCTATTCC TCCACCCACG CTACTGGCGG GGTTTCTGGC GGTATTAATT 
GGCTACGCCA GTTCAGCGGC AATAATCTGG CAAGCAGCGA TTGTCGCCGG AGCCACCACT 
GCACAAATCT CTGGCTGGAT GACGGCGCTG GGGCTGGCAA TGGGCGTCAG TACGCTGACT 
CTGACATTAT GGTATCGCGT ACCTGTTCTC ACCGCATGGT CAACGCCTGG CGCGGCTTTG 
TTGGTCACCG GATTGCAGGG ACTAACACTT AACGAAGCCA TCGGCGTTTT TATTGTCACC 
AACGCGCTAA TAGTCCTCTG CGGCATAACG GGACTCTTTG CTCGTCTGAT GCGCATTATT 
CCGCACTCGC TTGCGGCGGC AATGCTTGCC GGGATTTTAT TACGCTTTGG TTTACAGGCG 
TTTGCCAGTC TGGACGGTCA ATTTACGTTG TGTGGAAGTA TGTTGCTGGT ATGGCTGGCA 
ACCAAGGCCG TTGCGCCGCG CTATGCGGTA ATTGCCGCGA TGATTATTGG GATCGTGATC 
GTCATCGCGC AAGGTGACGT TGTCACAACT GATGTTGTCT TTAAACCCGT TCTCCCCACT 
TATATTACCC CTGATTTTTC GTTTGCTCAC AGCCTGAGCG TTGCACTCCC CCTTTTTCTG 
GTGACGATGG CATCGCAAAA CGCACCGGGT ATCGCAGCAA TGAAAGCAGC TGGATATTCG 
GCTCCTGTTT CGCCATTAAT TGTATTTACT GGATTGCTGG CACTGGTTTT TTCCCCTTTC 
GGCGTTTATT CCGTCGGTAT TGCGGCAATC ACCGCGGCTA TTTGCCAAAG CCCGGAAGCG 
CATCCGGATA AAGATCAACG TTGGCTGGCC GCTGCCGTTG CAGGCATTTT CTATTTGCTC 
GCAGGTCTGT TTGGTAGTGC CATTACCGGG ATGATGGCTG CCCTGCCCGT AAGTTGGATC 
CAGATGCTGG CAGGTCTGGC GCTGTTAAGT ACCATCGGCG GCAGTTTGTA TCAGGCGCTG 
CATAATGAGC GTGAGCGAGA CGCGGCGGTG GTGGCATTTC TGGTAACGGC AAGTGGATTG 
ACGCTGGTCG GGATTGGTTC TGCGTTTTGG GGATTAATTG CCGGAGGCGT TTGTTACGTG 
GTGTTGAATT TAATCGCTGA CAGAAACCGA TATTGA

Protein sequence

MRLFSIPPPT LLAGFLAVLI GYASSAAIIW QAAIVAGATT AQISGWMTAL GLAMGVSTLT 
LTLWYRVPVL TAWSTPGAAL LVTGLQGLTL NEAIGVFIVT NALIVLCGIT GLFARLMRII 
PHSLAAAMLA GILLRFGLQA FASLDGQFTL CGSMLLVWLA TKAVAPRYAV IAAMIIGIVI 
VIAQGDVVTT DVVFKPVLPT YITPDFSFAH SLSVALPLFL VTMASQNAPG IAAMKAAGYS 
APVSPLIVFT GLLALVFSPF GVYSVGIAAI TAAICQSPEA HPDKDQRWLA AAVAGIFYLL 
AGLFGSAITG MMAALPVSWI QMLAGLALLS TIGGSLYQAL HNERERDAAV VAFLVTASGL 
TLVGIGSAFW GLIAGGVCYV VLNLIADRNR Y