Gene ECH74115_4111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4111
Symbol	kduD
ID	6971538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3809295
End bp	3810056
Gene Length	762 bp
Protein Length	253 aa
Translation table	11
GC content	52%
IMG OID	643387866
Product	2-deoxy-D-gluconate 3-dehydrogenase
Protein accession	YP_002272306
Protein GI	209400700
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID	[TIGR01832] 2-deoxy-D-gluconate 3-dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.00000566262
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGATTTTAA GTGCATTTTC TCTCGAAGGT AAAGTTGCGG TCGTCACTGG TTGTGATACT 
GGGCTGGGCC AGGGGATGGC GTTGGGGCTG GCGCAAGCGG GCTGTGACAT TGTTGGCATT 
AACATCGTTG AACCGACTGA AACCATCAAG CAGGTCACGG CGCTGGGGCG TCGTTTTTTA 
AGCCTGACCG CCGATCTGCG AAAGATTGAT GGTATTCCTG GACTGCTGGA TCGCGCGGTA 
GCTGAGTTTG GTCATATTGA TATCCTGGTG AATAACGCCG GATTGATTCG CCGCGAAGAT 
GCTCTCGAGT TCAGCGAAAA GGACTGGGAC GATGTCATGA ACCTGAATAT CAAGAGCGTA 
TTCTTCATGT CTCAGGCAGC GGCGAAACAC TTCATCGCGC AAGGCAATGG CGGCAAGATT 
ATCAATATCG CGTCAATGCT CTCCTTCCAG GGCGGGATCC GTGTGCCTTC TTATACCGCA 
TCAAAAAGCG GCGTGATGGG CGTGACGCGA TTGATGGCGA ATGAATGGGC TAAACACAAC 
ATTAATGTTA ATGCGATAGC TCCGGGTTAC ATGGCGACCA ACAATACCCA ACAACTGCGG 
GCAGATGAAC AACGTAGCGC GGAAATTCTC GACCGCATTC CAGCTGGCCG TTGGGGACTG 
CCGAGTGACC TGATGGGGCC GGTAGTGTTT CTTGCCTCCA GCGCTTCAGA TTATGTAAAT 
GGTTATACCA TTGCTGTGGA TGGCGGTTGG CTGGCGCGTT AA

Protein sequence

MILSAFSLEG KVAVVTGCDT GLGQGMALGL AQAGCDIVGI NIVEPTETIK QVTALGRRFL 
SLTADLRKID GIPGLLDRAV AEFGHIDILV NNAGLIRRED ALEFSEKDWD DVMNLNIKSV 
FFMSQAAAKH FIAQGNGGKI INIASMLSFQ GGIRVPSYTA SKSGVMGVTR LMANEWAKHN 
INVNAIAPGY MATNNTQQLR ADEQRSAEIL DRIPAGRWGL PSDLMGPVVF LASSASDYVN 
GYTIAVDGGW LAR