Gene EcHS_A3635 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3635
Symbol	gntU
ID	5594795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3622757
End bp	3624097
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	55%
IMG OID	640922751
Product	low affinity gluconate transporter
Protein accession	YP_001460232
Protein GI	157162914
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG2610] H+/gluconate symporter and related permeases
TIGRFAM ID	[TIGR00791] gluconate transporter

Plasmid Coverage information

Num covering plasmid clones	49
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTACAT TAACGCTTGT TTTAACAGCA GTAGGGTCTG TTTTACTGCT GCTGTTTTTA 
GTCATGAAGG CGCGTATGCA CGCTTTCCTG GCTTTAATGG TGGTGTCCAT GGGGGCTGGC 
CTTTTTTCCG GTATGCCGCT CGATAAAATC GCAGCGACGA TGGAAAAAGG GATGGGAGGC 
ACCCTCGGCT TCCTGGCGGT GGTTGTCGCC CTGGGAGCTA TGTTTGGCAA GATCTTACAT 
GAAACCGGCG CAGTCGATCA GATTGCCGTC AAAATGCTCA AATCCTTCGG TCACAGCCGC 
GCGCATTATG CCATCGGCCT TGCGGGGCTG GTCTGTGCGC TACCGCTGTT CTTTGAAGTG 
GCGATTGTTC TGCTGATTAG CGTTGCTTTC TCAATGGCGC GCCACACCGG TACGAACCTG 
GTGAAGCTGG TAATCCCATT ATTCGCAGGC GTGGCGGCAG CGGCGGCGTT CCTGGTGCCA 
GGGCCAGCGC CAATGCTGCT GGCATCGCAG ATGAACGCCG ATTTTGGCTG GATGATCCTG 
ATTGGCCTGT GTGCGGCAAT TCCGGGAATG ATTATTGCCG GGCCGCTGTG GGGTAATTTC 
ATCAGCCGTT ACGTGGAGTT GCATATTCCT GACGACATCA GCGAACCGCA TCTCGGCGAA 
GGCAAAATGC CGTCCTTCGG ATTCAGCCTG TCGCTGATCC TGTTGCCGCT GGTGCTGGTG 
GGGCTGAAAA CCATTGCCGC GCGTTTTGTG CCAGAAGGCT CTACCGCTTA CGAATGGTTC 
GAGTTTATTG GTCATCCGTT TACCGCGATT CTGGTTGCTT GTCTGGTGGC GATTTATGGC 
CTGGCGATGC GTCAGGGCAT GCCAAAAGAC AAAGTGATGG AGATTTGCGG TCACGCGCTG 
CAACCGGCGG GGATCATTCT GCTGGTGATT GGTGCGGGCG GCGTGTTCAA ACAGGTGCTG 
GTTGACTCTG GCGTAGGTCC GGCACTGGGC GAAGCGTTAA CCGGCATGGG CCTGCCGATT 
GCTATCACCT GCTTCGTGCT GGCCGCTGCA GTGCGCATCA TTCAGGGGTC TGCCACCGTA 
GCCTGTTTAA CGGCGGTGGG ACTGGTGATG CCAGTCATTG AACAACTGAA CTACTCTGGT 
GCGCAAATGG CGGCACTGTC GATTTGTATC GCTGGTGGTT CGATTGTTGT CAGCCACGTT 
AACGACGCTG GTTTCTGGTT GTTCGGTAAA TTTACCGGCG CGACCGAAGC CGAAACGCTG 
AAAACCTGGA CCATGATGGA AACCATTCTC GGCACTGTCG GTGCCATCGT TGGGATGATT 
GCGTTCCAGC TGTTGAGTTA A

Protein sequence

MTTLTLVLTA VGSVLLLLFL VMKARMHAFL ALMVVSMGAG LFSGMPLDKI AATMEKGMGG 
TLGFLAVVVA LGAMFGKILH ETGAVDQIAV KMLKSFGHSR AHYAIGLAGL VCALPLFFEV 
AIVLLISVAF SMARHTGTNL VKLVIPLFAG VAAAAAFLVP GPAPMLLASQ MNADFGWMIL 
IGLCAAIPGM IIAGPLWGNF ISRYVELHIP DDISEPHLGE GKMPSFGFSL SLILLPLVLV 
GLKTIAARFV PEGSTAYEWF EFIGHPFTAI LVACLVAIYG LAMRQGMPKD KVMEICGHAL 
QPAGIILLVI GAGGVFKQVL VDSGVGPALG EALTGMGLPI AITCFVLAAA VRIIQGSATV 
ACLTAVGLVM PVIEQLNYSG AQMAALSICI AGGSIVVSHV NDAGFWLFGK FTGATEAETL 
KTWTMMETIL GTVGAIVGMI AFQLLS