Gene Acid345_3920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3920
Symbol	tdh
ID	4071303
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4634589
End bp	4635641
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	57%
IMG OID	637985946
Product	L-threonine 3-dehydrogenase
Protein accession	YP_592994
Protein GI	94970946
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR00692] L-threonine 3-dehydrogenase [TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.344166
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.087716
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAATA CAATGCTTGC AGTTATGAAA CCCGAGGCCG CTCCAGGCTC GGAGATTCGC 
GAAGTTCCTG TTCCTAAATT TGGACCGAAC GAAGTCCTCG TCAAAGTTAA AGTTGCTTCC 
ATCTGTGGTA CCGACCTCCA CATTTACAAC TGGGACCAGT GGGCCCAGCG CCGCATTAAG 
CCGCCGCTCA TCCCCGGCCA TGAGTTCTGT GGAGACGTGG TTGCGGTGGG TAGTGAAGTA 
ACGCTGGTGA AGGAAGGCGA TTTTGTTTCC GCCGAAATGC ACGTGAACTG CGGGAAGTGC 
CTGCAGTGCA GAACCGGACA GGCGCATATT TGCCAACACG TGAAGATCAT CGGCGTGGAC 
GCGAACGGCG CTTTCGCCGA GTACGTGGTG ATTCCGGAGT CGAACATCTG GAAGCTGGAT 
CCGGCGATTC CGCAGGAATA CGCCTCGATT CTCGATCCGC TCGGAAACGC GGTGCACACA 
GTGCTCGCGG GCGACATTGC TGCGAAGACC GTTGCGATCA CGGGCTGCGG ACCCATCGGG 
TTGTTTTCGA TCGCCGTGGC GAAAGCCTGT GGCGCGACGA AAGTGTTCGC CATCGAAGTA 
AATGAACACC GGCGCGCGAT CGCCAAGAAG ATGAAAGCCG ACTTCGTGCT CGATCCCACG 
AAGGACAACG TGAAGCAGGT GGTACTCGAT AACACTGAGG GCGTGGGTGT TGACGTTCTG 
CTCGAAATGG CTGGACGCCA GGACGCGATC AAACTCGGCT TCTCGATCCT CCGGCTCGGG 
GGACGCGCGT CCTTGCTCGG AATCCCTGGC AAGCCCATCG AGATCAACCT CGCGGAAGAC 
ATCATCTTCA AGGGCGCGAT CGTGCAGGGC ATCAACGGCC GCAAGATGTA TGAGACCTGG 
TACCAGATGG AAGCGCTGCT CAAGGCCAAG ATGCTCGATC TGCATCCGGT GATTACCGAC 
AAGATCCCGA TGAAGGACTT CAGCACGGCG ATGGCGCGAT TGCAGAGCGG TGAAGCCAGC 
AAGATTTTGA TGTATCCGAA TGGGACGAAA TAA

Protein sequence

MPNTMLAVMK PEAAPGSEIR EVPVPKFGPN EVLVKVKVAS ICGTDLHIYN WDQWAQRRIK 
PPLIPGHEFC GDVVAVGSEV TLVKEGDFVS AEMHVNCGKC LQCRTGQAHI CQHVKIIGVD 
ANGAFAEYVV IPESNIWKLD PAIPQEYASI LDPLGNAVHT VLAGDIAAKT VAITGCGPIG 
LFSIAVAKAC GATKVFAIEV NEHRRAIAKK MKADFVLDPT KDNVKQVVLD NTEGVGVDVL 
LEMAGRQDAI KLGFSILRLG GRASLLGIPG KPIEINLAED IIFKGAIVQG INGRKMYETW 
YQMEALLKAK MLDLHPVITD KIPMKDFSTA MARLQSGEAS KILMYPNGTK