Gene EcE24377A_1998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1998
Symbol	gutB
ID	5589857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	1983412
End bp	1984455
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	46%
IMG OID	640925670
Product	sorbitol dehydrogenase
Protein accession	YP_001463073
Protein GI	157155393
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.329256
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATT CAAAAGCAAT ATTGCAGGTG CCGGGCACAA TGAAAATTAT TTCAGCAGAA 
ATACCAGTGC CTAAAGAAGA TGAAGTTTTG ATTAAAGTAG AATATGTCGG TATTTGTGGT 
TCAGATGTAC ATGGTTTTGA ATCAGGCCCG TTTATTCCGC CTAAAGACCC AAATCAAGAA 
ATTGGCCTGG GTCATGAATG CGCCGGGACG GTTGTGGCTG TGGGAAGCCG CGTGCGCAAA 
TTTAAACCGG GGGATCGGGT AAATATCGAA CCTGGCGTTC CTTGCGGTCA CTGTCGTTAC 
TGTCTGGAAG GCAAATATAA CATCTGCCCG GACGTTGATT TTATGGCGAC ACAACCCAAC 
TACCGCGGCG CATTAACGCA CTATCTGTGT CATCCGGAGA GCTTTACTTA CAAACTGCCA 
GACAATATGG ACACGATGGA AGGGGCGCTG GTGGAGCCTG CCGCAGTCGG GATGCATGCC 
GCGATGCTGG CAGATGTTAA ACCGGGTAAG AAGATAATTA TTCTGGGAGC AGGTTGTATT 
GGTTTGATGA CGTTGCAAGC GTGCAAATGC CTGGGCGCAA CGGAAATTGC CGTCGTTGAT 
GTGCTGGAAA AACGTCTGAT AATGGCGGAA CAACTTGGTG CGACAGTGGT TATTAACGGC 
ACAAAAGAAG ACACTATTGC ACGCTGTCAG CAATTTACCG AAGACATGGG CGCAGATATT 
GTTTTCGAAA CAGCGGGTTC TGCGGTCACC GTTAAACAGG CACCTTATCT GGTAATGCGC 
GGCGGTAAAA TTATGATTGT TGGTACTGTA CCCGGCGATT CGGCAATCAA TTTCCTCAAA 
ATCAATCGCG AAGTCACTAT CCAGACGGTA TTCCGCTATG CCAATCGTTA TCCGGTCACG 
ATTGAAGCTA TTTCTTCAGG GCGATTCGAT GTGAAATCGA TGGTGACGCA TATTTACGAT 
TATCGGGATG TACAACAGGC ATTTGAAGAG TCAGTTAACA ACAAACGCGA CATTATTAAA 
GGCGTTATTA AAATTAGCGA TTAA

Protein sequence

MKNSKAILQV PGTMKIISAE IPVPKEDEVL IKVEYVGICG SDVHGFESGP FIPPKDPNQE 
IGLGHECAGT VVAVGSRVRK FKPGDRVNIE PGVPCGHCRY CLEGKYNICP DVDFMATQPN 
YRGALTHYLC HPESFTYKLP DNMDTMEGAL VEPAAVGMHA AMLADVKPGK KIIILGAGCI 
GLMTLQACKC LGATEIAVVD VLEKRLIMAE QLGATVVING TKEDTIARCQ QFTEDMGADI 
VFETAGSAVT VKQAPYLVMR GGKIMIVGTV PGDSAINFLK INREVTIQTV FRYANRYPVT 
IEAISSGRFD VKSMVTHIYD YRDVQQAFEE SVNNKRDIIK GVIKISD