Gene EcSMS35_3719 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3719
Symbol	gntU
ID	6143476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3789533
End bp	3790873
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	55%
IMG OID	641618545
Product	low affinity gluconate transporter
Protein accession	YP_001745685
Protein GI	170680129
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG2610] H+/gluconate symporter and related permeases
TIGRFAM ID	[TIGR00791] gluconate transporter

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTACAT TAACGCTTGT TTTAACAGCA GTAGGGTCTG TTTTACTGCT GCTGTTTTTA 
GTCATGAAGG CGCGTATGCA CGCTTTCCTG GCTTTAATGG TGGTGTCTAT GGGGGCTGGC 
CTTTTTTCCG GTATGCCGCT CGATAAAATC GCAGCGACGA TGGAAAAAGG GATGGGAGGC 
ACCCTCGGCT TCCTGGCGGT GGTTGTCGCC CTGGGAGCCA TGTTTGGCAA GATCTTACAT 
GAAACCGGCG CAGTCGATCA GATTGCCGTC AAAATGCTCA AATCCTTCGG TCACAGCCGC 
GCGCATTATG CCATCGGCCT TGCGGGGCTG GTCTGTGCGC TGCCGTTGTT CTTTGAAGTG 
GCGATTGTTC TGCTGATTAG CGTTGCTTTC TCAATGGCGC GCCACACCGG TACGAACCTG 
GTGAAGCTGG TAATCCCATT ATTTGCAGGC GTGGCGGCCG CTGCTGCGTT CCTGGTGCCT 
GGACCAGCGC CAATGCTGCT GGCATCGCAG ATGAACGCCG ACTTTGGCTG GATGATCCTG 
ATTGGCCTGT GTGCGGCAAT TCCGGGAATG ATTATTGCCG GGCCGCTGTG GGGTAATTTC 
ATCAGCCGCT ACGTGGAGCT GCATATTCCT GACGACATCA GCGAACCGCA TCTCGGCGAA 
GGCAAAATGC CATCTTTCGG ATTCAGCCTG TCGCTGATCC TGTTGCCGCT GGTGCTGGTA 
GGGCTGAAAA CCATTGCCGC GCGTTTTGTG CCAGAAGGCT CTACCGCTTA CGAATGGTTC 
GAGTTTATTG GTCATCCGTT TACCGCGATT CTGGTTGCTT GTCTGGTAGC GATTTATGGC 
CTGGCAATGC GTCAGGGCAT GCCGAAAGAT AAAGTGATGG AAATTTGCGG TCACGCGCTG 
CAACCGGCGG GGATCATTCT GCTGGTGATT GGTGCGGGCG GCGTATTCAA ACAGGTGCTG 
GTTGACTCTG GCGTAGGTCC GGCACTGGGC GAAGCGTTAA CCGGCATGGG CCTGCCGATT 
GCCATCACCT GCTTCGTGCT GGCAGCTGCA GTGCGCATCA TTCAGGGTTC TGCCACCGTT 
GCCTGTTTAA CGGCGGTGGG ACTGGTGATG CCGGTTATTG AACAACTGAA CTACTCCGGT 
GCGCAAATGG CGGCGCTGTC GATTTGTATC GCCGGTGGTT CGATTGTTGT CAGCCACGTT 
AACGACGCGG GTTTCTGGTT GTTCGGTAAA TTTACCGGCG CGACCGAAGC CGAAACGCTG 
AAAACCTGGA CCATGATGGA AACCATACTC GGCACTGTTG GTGCCATCGT TGGGATGATT 
GCGTTCCAGC TGTTGAGTTA A

Protein sequence

MTTLTLVLTA VGSVLLLLFL VMKARMHAFL ALMVVSMGAG LFSGMPLDKI AATMEKGMGG 
TLGFLAVVVA LGAMFGKILH ETGAVDQIAV KMLKSFGHSR AHYAIGLAGL VCALPLFFEV 
AIVLLISVAF SMARHTGTNL VKLVIPLFAG VAAAAAFLVP GPAPMLLASQ MNADFGWMIL 
IGLCAAIPGM IIAGPLWGNF ISRYVELHIP DDISEPHLGE GKMPSFGFSL SLILLPLVLV 
GLKTIAARFV PEGSTAYEWF EFIGHPFTAI LVACLVAIYG LAMRQGMPKD KVMEICGHAL 
QPAGIILLVI GAGGVFKQVL VDSGVGPALG EALTGMGLPI AITCFVLAAA VRIIQGSATV 
ACLTAVGLVM PVIEQLNYSG AQMAALSICI AGGSIVVSHV NDAGFWLFGK FTGATEAETL 
KTWTMMETIL GTVGAIVGMI AFQLLS