Gene Rsph17029_1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1037
Symbol	tdh
ID	4896461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	1071301
End bp	1072326
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	68%
IMG OID	640111624
Product	L-threonine 3-dehydrogenase
Protein accession	YP_001042920
Protein GI	126461806
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR00692] L-threonine 3-dehydrogenase [TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.210217
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGCAC TGGTGAAGGC CAAGGCGGAG CCGGGCCTCT GGATGGAAGA GCGGCCCGTG 
CCCGAGATCG GCCCCGACGA GGTGCTCATC CGGGTCCGCA AGACGGGGAT CTGCGGCACC 
GATGTCCATA TCTGGAACTG GGACGACTGG GCGGCGAAGA CGGTGCCGGT GCCGCTCGTC 
ACCGGGCACG AGTTTGCGGG CGAGATCGTC GAGGTGGGCC GCGACGTGCG CGACCTCAGC 
CCGGGCCAGC GCTGCTCGGG CGAGGGCCAT CTGATCGGCC ACCATTCGCG GCAGGTGCGG 
GCCGGGCGCT TCCATCTCGA TCCCGAGACG CGCGGCATCG GCGTCAATGT GCCGGGCGCC 
TTCGCCGACT ATCTGCGGCT TCCCGCCTTC AACGTGGTGC CGCTGCCCGA TGCCATCGAC 
GACGAGGTGG GGGCGATCCT CGATCCCCTC GGCAATGCCG TTCACACGGC GCTCAGCTTC 
GATCTGGTGG GAGAGGATGT GCTCGTGACC GGCGCAGGCC CCATCGGGAT CATGGCCGCG 
GCTGTGGCGC GGCATGTCGG CGCGCGCCAT GTCGTCATCA CCGACGTCAA TGCCGACCGG 
TTGCGGCTGT CAACCGAGGT GGCCGATGTG GTGCCGGTCA ATGTGGCGAC CGAGGATCTG 
CGTTCGGTGA TGGGCCGGCT GAAGATCGTG CAGGGCTTCG ACGTGGGGAT GGAAATGTCG 
GGCGCGCCCG CGGGCTTCGA CCAGATGGTC GAAGCGATGG TGATGGGCGG TCGCATCGCG 
ATGCTGGGGA TCCCGCCCGG CCGCAGCCCC GTGGACTGGA GCAGGATCGT CTTCAAGGCG 
CTGACCATCA AGGGCGTCTA CGGCCGCGAG ATCTTCGAGA CCTGGTACAA GATGATCGCG 
ATGCTGGAGA ACGGGCTCGA TATCCGGCGC GTCATCACCC ACCGCTTTCC TGTGGCGGAT 
TTCGCCGAGG GTTTTGCCGC CATGCGCAGC GGCGCGTCGG GCAAGGTGGT GCTGGACTGG 
GGCTGA

Protein sequence

MRALVKAKAE PGLWMEERPV PEIGPDEVLI RVRKTGICGT DVHIWNWDDW AAKTVPVPLV 
TGHEFAGEIV EVGRDVRDLS PGQRCSGEGH LIGHHSRQVR AGRFHLDPET RGIGVNVPGA 
FADYLRLPAF NVVPLPDAID DEVGAILDPL GNAVHTALSF DLVGEDVLVT GAGPIGIMAA 
AVARHVGARH VVITDVNADR LRLSTEVADV VPVNVATEDL RSVMGRLKIV QGFDVGMEMS 
GAPAGFDQMV EAMVMGGRIA MLGIPPGRSP VDWSRIVFKA LTIKGVYGRE IFETWYKMIA 
MLENGLDIRR VITHRFPVAD FAEGFAAMRS GASGKVVLDW G