Gene RSP_4033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_4033
Symbol	tdh
ID	3711803
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007488
Strand	+
Start bp	7843
End bp	8856
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	70%
IMG OID	640069306
Product	Zinc-containing alcohol dehydrogenase
Protein accession	YP_345173
Protein GI	77404599
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGCAG CGATTTTCGA CGGCAGCCCG ACGCTCCGGC TGACCGACCT TCCGATTCAG 
GAACCCGGCC CCGACGAGGT GCTGATCCGC ATCGATTCCG CCACGATCTG CGGCACCGAT 
CAGCATATCC TCGAGGGCAA GTTCTGGGCG AAGCCCCCGG TGGTGCTGGG CCATGAATTC 
GCGGGCTACG TCGAGCGCGT GGGCGAGCGG GTGCAGAACT GCAGGCCGGG CGATCTCGTC 
TCGGTCGAGC CGCATGTCTA TTGCGGCTGC TGCAAGCCCT GCCGGCTCGG CAAGCCGCAT 
CTCTGCCTCG ACCGTCTGGC TTGGGGGATC AACCTCAACG GCGGGTTCGA GCAATATGCC 
ACCGTGCGGA TGGACACCGT CTATCAGGTG CCGGAAGGCA TCGGCCCCGA AGAGGCGGCT 
CTGGGCGAGA TCACCGGCTG CTGCATGCAC GGGATCGACC GCGTGGGGGT CGAGCTCGGC 
GATCTCGTCG TGATCCTCGG CGGCGGCGCG GCGGGCCTGA TCCTCGCCCG GCTGGCCGAG 
CTGCGCGGGG CCGCGCGCAT CGTCATCTCC GAGCCGAACG CCGCCCGGCG CGAGCAGATC 
CGCGCCTTCG GCTACCCGGA CGTGGTCGAC CCGCTGAACG AGGATCTGGC CGCCCGCATC 
GGCGCCCTGA CCGACGGGCT CGGCGCCGAC GTGGTGATCG AGGCCGCGGG CCGCGCCGAG 
ACGGCCGCGC AGGCGGTGGA GCTCGTCTGC CACGGCGGGC GCGTCCTCTT CTTCGGCGTG 
GCCGCCCCCG GCACCATGGC CGCCATCGAG CCGAACCGGA TCTTCGCGCG CGAGATCACG 
GTCGTGGGCT CGATCCGCAA CCCCTATACC CACCACCGCG TGATGGAGAT CCTGCCCCGG 
CTCCGGCTGA AGGACATCGT CACCCACCGC TTCCCGCTGG AGAATATCGC CGAGGCCTTC 
GACGCCGCCC ACCGCGGCGA GGGCCTCAAG ATCTGCATCA AGCCGAACGG CTGA

Protein sequence

MKAAIFDGSP TLRLTDLPIQ EPGPDEVLIR IDSATICGTD QHILEGKFWA KPPVVLGHEF 
AGYVERVGER VQNCRPGDLV SVEPHVYCGC CKPCRLGKPH LCLDRLAWGI NLNGGFEQYA 
TVRMDTVYQV PEGIGPEEAA LGEITGCCMH GIDRVGVELG DLVVILGGGA AGLILARLAE 
LRGAARIVIS EPNAARREQI RAFGYPDVVD PLNEDLAARI GALTDGLGAD VVIEAAGRAE 
TAAQAVELVC HGGRVLFFGV AAPGTMAAIE PNRIFAREIT VVGSIRNPYT HHRVMEILPR 
LRLKDIVTHR FPLENIAEAF DAAHRGEGLK ICIKPNG