Gene Rleg_2958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_2958
Symbol	tdh
ID	8015744
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	2947482
End bp	2948519
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	62%
IMG OID	644825528
Product	L-threonine 3-dehydrogenase
Protein accession	YP_002976756
Protein GI	241205660
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR00692] L-threonine 3-dehydrogenase [TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.108215
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.634974
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAACA TGATGAAGGC GCTGGTCAAA GCAAAACCCG AGGTCGGGCT TTGGATGGAG 
AATGTGCCGA TGCCCGAGGT CGGGCCGAAC GACGTGCTTA TCCGGGTGAA GAAATCGGCG 
ATCTGCGGCA CTGACGTCCA TATCTGGAAC TGGGACCAGT GGGCGCAGAA GACCATTCCG 
GTGCCGATGG TGGTTGGCCA TGAATTCTCC GGCGAGATCG CCGAGATCGG TTCGGCGGTC 
ACCCGCTATC ATATCGGCGA GCGGGTCTCC GGCGAGGGGC ATATCGTCTG CGGCAAGTGC 
CGCAACTGCC GGGCGGGCAG GGGGCATCTC TGCCGCAACA CGCTCGGTGT CGGCGTCAAC 
CGCCCGGGTT CGTTCGGTGA GTTCGTCTGC ATTCCGGAAA GCAATGTCGT GCCGATCCCG 
GATGATATTT CCGACGAGAT CGCCGCGATC TTCGATCCGT TCGGCAATGC CGTGCACACC 
GCGCTTTCCT TCGATCTCGT CGGTGAGGAC GTGCTCGTCA CCGGCGCCGG GCCGATCGGC 
ATCATGGGCG CGCTCGTCGC CAAACGATCC GGCGCCCGCA AGGTCGTCAT CACCGATATC 
AATCCGCACC GGCTGGAGCT GGCGCGCAAG CTCGGCATCG ACCACGTCGT CGACGCATCG 
AAGGAAAACC TCGCCGACGT GATGAAGGCG ATCGGCATGA CGGAGGGTTT CGACGTCGGG 
CTCGAAATGT CGGGGGCCGC ACCTGCCTTC CGCGACATGA TCGACAAGAT GAACAATGGC 
GGCAAGATCG CCATCCTCGG CATCGCGCCG GCGGGCTTCG AAATCGACTG GAACAAGGTG 
ATCTTCAAGA TGCTCAATCT CAAGGGCATC TACGGCCGCG AGATGTTCGA GACCTGGTAC 
AAGATGATCG CCTTCGTCCA AGGCGGCCTC GATCTCGCGC CCATCATCAC CCACCGGATC 
GGCATCGACG ATTTCCGCGA CGGCTTCGAG GCGATGCGGT CGGGCAATTC CGGCAAGGTT 
GTGATGGACT GGATGTGA

Protein sequence

MSNMMKALVK AKPEVGLWME NVPMPEVGPN DVLIRVKKSA ICGTDVHIWN WDQWAQKTIP 
VPMVVGHEFS GEIAEIGSAV TRYHIGERVS GEGHIVCGKC RNCRAGRGHL CRNTLGVGVN 
RPGSFGEFVC IPESNVVPIP DDISDEIAAI FDPFGNAVHT ALSFDLVGED VLVTGAGPIG 
IMGALVAKRS GARKVVITDI NPHRLELARK LGIDHVVDAS KENLADVMKA IGMTEGFDVG 
LEMSGAAPAF RDMIDKMNNG GKIAILGIAP AGFEIDWNKV IFKMLNLKGI YGREMFETWY 
KMIAFVQGGL DLAPIITHRI GIDDFRDGFE AMRSGNSGKV VMDWM