Gene SeHA_C4033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4033
Symbol	tdh
ID	6488017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3915892
End bp	3916917
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	54%
IMG OID	642744134
Product	L-threonine 3-dehydrogenase
Protein accession	YP_002047739
Protein GI	194447834
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR00692] L-threonine 3-dehydrogenase [TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCGT TATCCAAACT GAAAGCGGAA GAGGGCATCT GGATGACCGA CGTTCCGGAA 
CCGGAAGTCG GCCATAACGA TTTGCTGATT AAAATCCGTA AAACAGCCAT CTGCGGTACT 
GACGTTCACA TCTATAACTG GGATGACTGG TCGCAAAAAA CCATCCCGGT TCCGATGGTC 
GTGGGGCATG AATATGTCGG CGAAGTGGTC GGCATCGGTC AGGAAGTGAA AGGCTTTAAA 
ATCGGCGATC GCGTCTCCGG CGAAGGTCAC ATCACCTGCG GTCATTGCCG CAACTGCCGC 
GGCGGTCGCA CTCACCTGTG TCGCAACACC ACCGGCGTGG GCGTCAACCG TCCCGGCTGC 
TTTGCGGAAT ACCTGGTCAT CCCGGCGTTC AATGCGTTTA AAATCCCGGA TAACATTTCT 
GATGATTTAG CCTCTATTTT CGACCCGTTT GGTAATGCGG TGCATACGGC GCTGTCTTTC 
GATCTGGTCG GCGAAGATGT ACTGGTATCG GGGGCGGGGC CAATCGGCGT AATGGCCGCC 
GCGGTGGCGA AACATGTCGG CGCGCGTCAT GTGGTGATTA CTGACGTCAA TGAATACCGT 
CTGGAGCTGG CGCGTAAAAT GGGCGTCACC CGCGCGGTCA ACGTCGCGAA AGAGAGCCTG 
AACGACGTTA TGGCGGAGCT GGGAATGACC GAAGGGTTCG ATGTGGGTCT GGAGATGTCC 
GGCGCGCCGC CGGCGTTTCG TACCATGCTG GACACCATGA ATCACGGCGG TCGTATTGCG 
ATGCTGGGGA TTCCGCCATC AGATATGTCT ATCGACTGGA CAAAAGTTAT CTTTAAGGGC 
TTGTTCATTA AAGGTATTTA TGGTCGTGAG ATGTTCGAAA CGTGGTACAA AATGGCGGCG 
CTGATCCAGT CCGGTCTGGA TCTGTCACCG ATTATCACCC ATCGTTTCTC TATTGATGAT 
TTCCAGAAAG GTTTTGATGC CATGCGTTCA GGCCAGTCAG GAAAAGTTAT TCTGAGCTGG 
GATTAA

Protein sequence

MKALSKLKAE EGIWMTDVPE PEVGHNDLLI KIRKTAICGT DVHIYNWDDW SQKTIPVPMV 
VGHEYVGEVV GIGQEVKGFK IGDRVSGEGH ITCGHCRNCR GGRTHLCRNT TGVGVNRPGC 
FAEYLVIPAF NAFKIPDNIS DDLASIFDPF GNAVHTALSF DLVGEDVLVS GAGPIGVMAA 
AVAKHVGARH VVITDVNEYR LELARKMGVT RAVNVAKESL NDVMAELGMT EGFDVGLEMS 
GAPPAFRTML DTMNHGGRIA MLGIPPSDMS IDWTKVIFKG LFIKGIYGRE MFETWYKMAA 
LIQSGLDLSP IITHRFSIDD FQKGFDAMRS GQSGKVILSW D