Gene Hoch_2121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2121
Symbol
ID	8544507
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	2941537
End bp	2942385
Gene Length	849 bp
Protein Length	282 aa
Translation table	11
GC content	70%
IMG OID	646386828
Product	short-chain dehydrogenase/reductase SDR
Protein accession	YP_003266559
Protein GI	262195350
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0891264
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.29276
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGACA CTCCCACTGC GGCATCTCAG CACATCTTCG CGCCCGGCCT GTTCCGCGGT 
CAGCGCGTCA TCGTCACCGG CGGCGGCTCG GGCATCGGCC TGGCGAGCGC GCGCGCGTTC 
GCGCGTCTGG GAGCGCGCGT GGCCATCTGC GGCCGCGACG AGGACAAGCT CGCAGCCGCG 
CGCGACGAGC TGCAAGCCGT GGCCGACGAA GCTCGCGCCG CCGCCGCCGA GGCCGACAGC 
GAAGGCGAGA TGGTCTACGC CGCACCCTGC GATATCCGCT CGGCCGAGAC GGTCGAGGGC 
TTCGTCGGCG CGGTGCGCGA GCGCTTTGGC GGCATCGACG TGCTGTTCAA CAACGCCGGC 
GGTCAGTTCG CATCACCGGC CACGGGCATC TCGCCCAAGG GCTTCGCCGC GGTGGTTCGC 
AATAACCTCG AGGGCACCTA TTACATGACC CACGCGGTCG CCACGCAGGC CATGATCCCG 
CAGCGCGGCG GTTGTATCGT CAACATGAGC GCCAACGTGT ATCGTGGCTT CCCCGGCATG 
GTGCACACCG GAGCCGCGCG CGCCGGGGTC GAGAACATGA CCATGACGCT GGCGGTCGAG 
TGGGCCAGCT ACGGCATCCG CATCAACGCG GTGGCCCCGG GCATCATCCT GTCGTCGGGG 
ACCGATCAGT ACCCGCCCGC GATCCTGTCG CGCGCGCTGT CGCAGGTGCC GATCGCGCGC 
GGCGGCACGG TCGAGGAGGT GGCCGCGGCC GTGGTATTCC TGGCCTCGCC CGCAGCCCAG 
TACATCTCCG GGGTGTCGCT GCGCATCGAC GGCGGCATCA GCCTCAGCGG CGAGATGTTT 
CCCCGCTGA

Protein sequence

MNDTPTAASQ HIFAPGLFRG QRVIVTGGGS GIGLASARAF ARLGARVAIC GRDEDKLAAA 
RDELQAVADE ARAAAAEADS EGEMVYAAPC DIRSAETVEG FVGAVRERFG GIDVLFNNAG 
GQFASPATGI SPKGFAAVVR NNLEGTYYMT HAVATQAMIP QRGGCIVNMS ANVYRGFPGM 
VHTGAARAGV ENMTMTLAVE WASYGIRINA VAPGIILSSG TDQYPPAILS RALSQVPIAR 
GGTVEEVAAA VVFLASPAAQ YISGVSLRID GGISLSGEMF PR