Gene ECH74115_4408 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4408
Symbol	exuT
ID	6968820
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4087939
End bp	4089237
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	54%
IMG OID	643388129
Product	hexuronate transporter
Protein accession	YP_002272566
Protein GI	209397929
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00893] d-galactonate transporter

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.591703
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAAA TTAAAGGGTT ACGTTGGTAT ATGATCGCAC TGGTGACGCT CGGCACCGTG 
CTTGGTTACC TGACGCGTAA CACTGTGGCG GCAGCTGCGC CAACTCTGAT GGAAGAGTTA 
AACATCTCCA CCCAACAGTA TTCCTATATC ATCGCAGCCT ATTCTGCTGC TTATACGGTC 
ATGCAACCGG TAGCAGGTTA TGTACTGGAT GTGCTGGGTA CGAAAATCGG TTATGCAATG 
TTTGCTGTGC TGTGGGCCGT GTTCTGTGGT GCAACCGCGC TGGCAGGTAG CTGGGGTGGC 
CTGGCTGTTG CTCGTGGTGC GGTCGGTGCC GCGGAAGCAG CGATGATCCC GGCGGGTCTG 
AAAGCCAGCT CCGAATGGTT CCCGGCGAAA GAGCGTTCCA TCGCAGTAGG CTATTTTAAC 
GTAGGTTCTT CGATTGGTGC GATGATTGCG CCGCCGCTGG TGGTATGGGC AATCGTGATG 
CACAGCTGGC AGATGGCATT TATCATCTCC GGTGCATTGA GCTTTATCTG GGCGATGGCA 
TGGCTGATTT TCTATAAACA TCCGCGCGAC CAGAAGCATC TGACCGATGA AGAACGCGAC 
TATATTATTA ATGGTCAGGA AGCCCAGCAC CAGGTGAGTA CGGCGAAGAA AATGTCCGTT 
GGTCAGATCC TGCGTAACCG TCAGTTCTGG GGTATCGCGC TGCCGCGTTT CCTGGCAGAA 
CCGGCCTGGG GTACTTTTAA CGCGTGGATC CCGCTGTTCA TGTTTAAAGT TTACGGCTTT 
AACCTGAAAG AGATCGCGAT GTTCGCCTGG ATGCCGATGC TGTTTGCTGA CCTCGGTTGT 
ATCCTCGGTG GTTACCTGCC GCCGCTGTTC CAGCGTTGGT TTGGTGTGAA CCTGATCGTT 
TCCCGTAAGA TGGTCGTAAC GCTGGGTGCA GTGCTGATGA TTGGCCCGGG TATGATCGGC 
CTGTTCACCA ACCCGTATGT CGCAATTATG CTGCTGTGTA TCGGTGGTTT TGCCCACCAG 
GCACTGTCTG GCGCGCTGAT TACGCTCTCT TCCGACGTGT TTGGTCGTAA CGAAGTGGCA 
ACGGCGAACG GTTTAACCGG GATGTCCGCA TGGCTGGCAA GTACGCTGTT TGCGCTGGTT 
GTCGGTGCAC TGGCTGACAC CATCGGCTTC AGCCCGCTGT TCGCAGTTCT GGCAGTATTT 
GACCTGCTGG GTGCGCTGGT TATCTGGACC GTATTGCAGA ACAAACCGGC GATTGAGGTG 
GCGCAGGAAA CACATAACGA TCCCGCACCG CAACATTAA

Protein sequence

MRKIKGLRWY MIALVTLGTV LGYLTRNTVA AAAPTLMEEL NISTQQYSYI IAAYSAAYTV 
MQPVAGYVLD VLGTKIGYAM FAVLWAVFCG ATALAGSWGG LAVARGAVGA AEAAMIPAGL 
KASSEWFPAK ERSIAVGYFN VGSSIGAMIA PPLVVWAIVM HSWQMAFIIS GALSFIWAMA 
WLIFYKHPRD QKHLTDEERD YIINGQEAQH QVSTAKKMSV GQILRNRQFW GIALPRFLAE 
PAWGTFNAWI PLFMFKVYGF NLKEIAMFAW MPMLFADLGC ILGGYLPPLF QRWFGVNLIV 
SRKMVVTLGA VLMIGPGMIG LFTNPYVAIM LLCIGGFAHQ ALSGALITLS SDVFGRNEVA 
TANGLTGMSA WLASTLFALV VGALADTIGF SPLFAVLAVF DLLGALVIWT VLQNKPAIEV 
AQETHNDPAP QH