Gene Hoch_3598 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3598
Symbol
ID	8545988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	4953499
End bp	4954512
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	77%
IMG OID	646388267
Product	putative dehydrogenase
Protein accession	YP_003267993
Protein GI	262196784
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.927271
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00450633
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCCACG ATCCCGACGC GCCGCGCTCC GGCCCGGGTC GGCCGCTGCG GGCGCGCGCG 
CTGTGGCTCG AGGAGCCCGG ACGGGCCGCG CTGCGCGAGG GCGACGTGCC CGCGCCCGGC 
CCCGAGCAGG TGCTGGTGCG CGCGCTGGCC AGCGGCGTGA GCCGCGGCAC CGAGTCGCTG 
GTGTTCGCCG GCCGCGTGCC CGAGAGCGAA CATCAGCGCA TGCGCGCGCC GTTTCAGGAG 
GGCGACTTCC CCGCGCCCGT CAAATACGGC TACGCCAGCG TCGGCGTGGT CGAGCGCGGC 
CCCGACGCGC TCGTCGGCCG GCGCGTGTTC TGCCTGTACC CGCACCAGGA GCGCTACGTG 
GTCGACGCCG CGCGCGTCAC CCCGCTGCCC GACGCCGTGC CGACGGAGCG CGCGGTGCTG 
GCCGCCAACA TGGAGACCGC GGTCAACGCG CTGTGGGATG CGGGCGTGCG CGTCGGCGAC 
CGCGTCGCCG TGGTCGGTGG CGGCGTGGTC GGGCTGCTGT GCGCGCACCT GGCCGCCGGC 
ATCCCGGGCG CGACGCTCGA GCTGGTCGAT ATCGACGCCG GCCGCGCGCC CGTGGCCGAG 
GCCCTGGGCC TGCGCCTGGT CACGCCCGAG CAGGCCCGCG GCGACTGCGA CCTGGTGCTG 
CACTGCTCGG GCAGCCCGTC CGGACTGCGC ACCGCGCTGG GCCTGGCCGG CTTCGAGGCC 
ACCGTGCTCG AGCTGTCCTG GTTCGGCAGC CGCGAGGTGA GCCTGCCGCT GGGCGAGGCC 
TTCCACGCCG GCCGCCTCAC CCTGCGCGCC TCGCAGGTGG GCACCGTCGC CACCAGCCGG 
CGCGCGCGCA AGAGCTACGG CGACCGCCTG GCCCTGGCCC TGCGCCTGCT CGAGGACGCG 
CGCCTCGACG CGCTGCTCAA TAGCCGCTCG TCGCTGACCG AGCTGCCCGC CCGCATGGCC 
GAGATCACCC GGCCCGAGGC CGGCGTGCTG TGCCACGTGG TCGTCTACGA GTAG

Protein sequence

MTHDPDAPRS GPGRPLRARA LWLEEPGRAA LREGDVPAPG PEQVLVRALA SGVSRGTESL 
VFAGRVPESE HQRMRAPFQE GDFPAPVKYG YASVGVVERG PDALVGRRVF CLYPHQERYV 
VDAARVTPLP DAVPTERAVL AANMETAVNA LWDAGVRVGD RVAVVGGGVV GLLCAHLAAG 
IPGATLELVD IDAGRAPVAE ALGLRLVTPE QARGDCDLVL HCSGSPSGLR TALGLAGFEA 
TVLELSWFGS REVSLPLGEA FHAGRLTLRA SQVGTVATSR RARKSYGDRL ALALRLLEDA 
RLDALLNSRS SLTELPARMA EITRPEAGVL CHVVVYE