Gene EcSMS35_3385 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3385
Symbol	exuT
ID	6142629
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3469938
End bp	3471236
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	54%
IMG OID	641618214
Product	hexuronate transporter
Protein accession	YP_001745363
Protein GI	170683899
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00893] d-galactonate transporter

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAAA TTAAAGGGTT ACGTTGGTAT ATGATCGCAC TGGTGACGCT CGGCACCGTG 
CTTGGTTACC TGACGCGTAA CACTGTGGCG GCAGCTGCGC CAACTCTGAT GGAAGAGTTA 
AACATCTCCA CCCAACAGTA TTCCTATATC ATCGCAGCGT ATTCTGCTGC TTATACGGTC 
ATGCAACCGG TAGCGGGTTA TGTACTGGAT GTGCTGGGTA CGAAAATCGG TTATGCAATG 
TTTGCTGTAC TGTGGGCCGT GTTCTGTGGT GCAACCGCGC TGGCAGGTAG TTGGGGTGGC 
CTGGCGGTTG CTCGTGGTGC GGTCGGTGCC GCGGAAGCCG CGATGATTCC GGCGGGTCTG 
AAAGCCAGCT CCGAATGGTT CCCGGCGAAA GAGCGTTCCA TCGCGGTAGG TTACTTTAAC 
GTAGGTTCTT CGATTGGTGC GATGATTGCG CCGCCGCTGG TGGTATGGGC AATCGTGATG 
CACAGCTGGC AGATGGCATT TATCATCTCC GGTGCGTTGA GCTTTATCTG GGCGATGGCA 
TGGCTGATTT TCTACAAGCA TCCGCGCGAC CAGAAACATC TGACCGATGA AGAACGCGAC 
TACATTATTA ATGGTCAGGA AGCCCAGCAC CAGGTTGACA CAGCGAAGAA AATGTCCGTT 
GGTCAGATCC TGCGCAACCG TCAGTTCTGG GGTATCGCGC TGCCGCGCTT CCTGGCAGAA 
CCGGCATGGG GTACTTTTAA CGCGTGGATC CCGCTGTTCA TGTTTAAAGT TTACGGCTTT 
AACCTGAAAG AGATCGCGAT GTTTGCCTGG ATGCCGATGC TGTTTGCTGA CCTCGGTTGT 
ATCCTCGGTG GTTACCTGCC GCCGCTGTTC CAGCGTTGGT TTGGTGTGAA CCTGATCGTT 
TCCCGTAAGA TGGTCGTAAC GCTGGGTGCT GTGCTGATGA TTGGCCCGGG TATGATCGGT 
CTGTTCACCA ACCCGTATGT CGCGATTATG CTGCTGTGTA TCGGTGGTTT TGCTCACCAG 
GCACTGTCTG GCGCACTGAT TACGCTCTCT TCTGACGTGT TCGGTCGTAA CGAAGTGGCG 
ACGGCGAACG GTTTAACCGG GATGTCCGCA TGGCTGGCAA GTACGCTCTT TGCTCTGGTG 
GTTGGTGCAC TGGCTGACAC CATCGGCTTT AGCCCGCTGT TCGCAGTACT TGCGGTATTC 
GACCTACTGG GGGCACTGGT TATCTGGACG GTATTGCAGA ACAAACCGGC GATTGAGGTG 
GCGCAGGAAT CACATAACGA TCCCGCACCG CAACATTAA

Protein sequence

MRKIKGLRWY MIALVTLGTV LGYLTRNTVA AAAPTLMEEL NISTQQYSYI IAAYSAAYTV 
MQPVAGYVLD VLGTKIGYAM FAVLWAVFCG ATALAGSWGG LAVARGAVGA AEAAMIPAGL 
KASSEWFPAK ERSIAVGYFN VGSSIGAMIA PPLVVWAIVM HSWQMAFIIS GALSFIWAMA 
WLIFYKHPRD QKHLTDEERD YIINGQEAQH QVDTAKKMSV GQILRNRQFW GIALPRFLAE 
PAWGTFNAWI PLFMFKVYGF NLKEIAMFAW MPMLFADLGC ILGGYLPPLF QRWFGVNLIV 
SRKMVVTLGA VLMIGPGMIG LFTNPYVAIM LLCIGGFAHQ ALSGALITLS SDVFGRNEVA 
TANGLTGMSA WLASTLFALV VGALADTIGF SPLFAVLAVF DLLGALVIWT VLQNKPAIEV 
AQESHNDPAP QH