Gene Smed_2224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2224
Symbol	tdh
ID	5323085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2302218
End bp	2303252
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	60%
IMG OID	640791162
Product	L-threonine 3-dehydrogenase
Protein accession	YP_001327891
Protein GI	150397424
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR00692] L-threonine 3-dehydrogenase [TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAATA TGATGAGGGC ACTCGTAAAG ACCAGGCCCG AGGTGGGGCT CTGGATGGAG 
CGGGTGCCGG TCCCGGAAGT CGGGCCGAAT GATGTTCTGA TCCGCGTCAG GAAATCGGCG 
ATCTGCGGCA CCGATGTCCA TATCTGGAAC TGGGATCAAT GGGCGCAGAA AACGATTCCC 
GTGCCGATGG TCGTCGGGCA CGAATTCATG GGCGAAATCG TCGAGGTCGG GCCGGCCGTG 
ACGAAGCATC ATGTCGGCGA GCGGGTTTCC GGAGAGGGCC ACATCGTTTG CGGCAAGTGC 
CGCAATTGCC GCGCCGGCAG GGGGCATCTC TGCCGCAACA CCCTCGGCGT CGGCGTCAAC 
CGTCCCGGCT CCTTCGCCGA ATTCGTGTGT CTGCCGGAAT ATAATGTCGT GTCGATCCCG 
GACGACGTTC CCGACGAGAT CGCCGCGATC TTCGATCCCT TCGGCAACGC TGTGCACACA 
GCGCTCTCCT TCGATCTCGT CGGCGAAGAC GTGCTTGTCA CCGGCGCTGG GCCGATCGGC 
ATCATGGGGG CTTTGGTTGC CAAGCGGTGC GGTGCCCGCA AGGTCGTGAT CACCGACATC 
AATCCGGTCC GCCTCGATCT CGCGCGCAAG GTCGGTATCG ACTATGTCGT CGACGCATCG 
AAGGAAAATC TCGCCGATGT GATGCGGGTG ATCGGCATGA CCGAGGGCTT CGATGTCGGC 
CTGGAAATGT CGGGTGCCGC ACCCGCCTTT CGCGACATGA TCGACAAGAT GAACAATGGC 
GGCAAGATCG CAATCCTCGG CATTGCGCCG GCGGGCTTCG AAATCGACTG GAACAAGGTG 
ATCTTCAAGA TGCTCAATCT GAAGGGCATC TATGGTCGAG AGATGTTCGA GACCTGGTAC 
AAGATGATCG CCTTCGTCCA GGGCGGGCTT GACCTTTCAC AGATAATCAC GCACCGCATC 
GGCATCGACG AGTTTGGTGA CGGCTTCGAA GCGATGCGCT CTGGCAATTC CGGCAAGGTC 
GTGATGGACT GGTAG

Protein sequence

MTNMMRALVK TRPEVGLWME RVPVPEVGPN DVLIRVRKSA ICGTDVHIWN WDQWAQKTIP 
VPMVVGHEFM GEIVEVGPAV TKHHVGERVS GEGHIVCGKC RNCRAGRGHL CRNTLGVGVN 
RPGSFAEFVC LPEYNVVSIP DDVPDEIAAI FDPFGNAVHT ALSFDLVGED VLVTGAGPIG 
IMGALVAKRC GARKVVITDI NPVRLDLARK VGIDYVVDAS KENLADVMRV IGMTEGFDVG 
LEMSGAAPAF RDMIDKMNNG GKIAILGIAP AGFEIDWNKV IFKMLNLKGI YGREMFETWY 
KMIAFVQGGL DLSQIITHRI GIDEFGDGFE AMRSGNSGKV VMDW