Gene GM21_0049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0049
Symbol	tdh
ID	8135348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	60331
End bp	61374
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	64%
IMG OID	644867666
Product	L-threonine 3-dehydrogenase
Protein accession	YP_003019894
Protein GI	253698705
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR00692] L-threonine 3-dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.000000160501
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCGAAGA CCATGCAGGC GCTGGTTAAG AAATACCCGA AGCCCGGGCT GTGGCTCGAC 
GAAGTCCCCG TCCCGGAGGT TGGGATCAAC GACGTGCTGA TCAAGGTCCA CAAGACCGCG 
GTCTGCGGCA CCGATCTGCA CATCTGGGAC TGGAACGACT GGGCCCGTAA AACCATTCCG 
GTCCCCATGG TGGTGGGCCA CGAGTTCGTG GGACGGGTGG CCGCCATGGG AAGCAACGTC 
GCCGACCTGA ACATCGGGGA CATCGTCTCC GGCGAGGGGC ACATCGTCTG CGGCAGGTGC 
CGCAACTGCC TGGCCGGCAG GCGCCACCTC TGCAAGGACA CCAACGGGGT GGGGGTCAAC 
CGCGCCGGCG CTTTCGCCGA GTACATCTGC ATCCCGGTCA CCAACGTCTG GCACGCCGAC 
CCCACCATCC CCATGGAAAT CCTGGGGATC TTCGATCCCT TCGGCAACGC GACCCACACC 
ACCCTCGCCT TCCCCATCCT GGGGGAGGAC GTACTCATCA CCGGCGCCGG CCCGATCGGC 
ATCATGGCGA CGGCCATAGC CCGCCACGCC GGGGCGCGCT ACATCGTGGT GACCGACCTG 
AACCAGTACC GGCTCGACCT GGCGAAGAAG ATGGGGGCGA CGGTGGCCTT GAACGTCAGG 
GAGGGGACCC TGGCACAGGT GCGGCAGCAG CTGGGGATGA AGGAGGGGTT CGACGTGGGG 
CTGGAGATGT CGGGAAACGG CGACGCCTTC AAGGAGATGC TGTCCAACAT GTGCCACGGC 
GGCAAGATCG CCATGCTGGG GCTCCCTTCT GCGGATATCT CCATCGACTG GAACCAGGTG 
ATCTTCAACA TGCTGACCAT CAAGGGGATC TACGGCCGGG AGATGTACGA GACCTGGTAC 
CTGATGCAGT CCCTGATCAA GATCGGGCTG GATCTCTCGC CGGTCATCAC GCACCGGATG 
CACTACACGC AGTTCGAGGA GGCGTTCCGG GTGATGAGCA CCGGCAACGC GGGGAAGGTG 
ATGCTCAACT GGGTCGAGGA GTGA

Protein sequence

MPKTMQALVK KYPKPGLWLD EVPVPEVGIN DVLIKVHKTA VCGTDLHIWD WNDWARKTIP 
VPMVVGHEFV GRVAAMGSNV ADLNIGDIVS GEGHIVCGRC RNCLAGRRHL CKDTNGVGVN 
RAGAFAEYIC IPVTNVWHAD PTIPMEILGI FDPFGNATHT TLAFPILGED VLITGAGPIG 
IMATAIARHA GARYIVVTDL NQYRLDLAKK MGATVALNVR EGTLAQVRQQ LGMKEGFDVG 
LEMSGNGDAF KEMLSNMCHG GKIAMLGLPS ADISIDWNQV IFNMLTIKGI YGREMYETWY 
LMQSLIKIGL DLSPVITHRM HYTQFEEAFR VMSTGNAGKV MLNWVEE