Gene Hoch_3082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3082
Symbol
ID	8545470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	4253738
End bp	4254769
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	68%
IMG OID	646387753
Product	aldo/keto reductase
Protein accession	YP_003267481
Protein GI	262196272
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0228208
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.204358
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTACA CCAAACTCGG AAACACGGGC CTCACCGTGT CGCGCATCTG TCTCGGCTGC 
ATGAGCTACG GCGAGGCCGG AGACGGCAGC TCGAGCCTCA AACACGCGTG GACGCTCGAC 
GAGGACACCA GCCGCGGGTT CTTCCGGCGC GCGCTCGAGG CCGGCATCAA CTTCTTCGAC 
ACGGCCAACG GCTACTCCGA GGGCAGCTCC GAAGAGTTTC TCGGACGGGC GATGCAGGCG 
CTGGCGCGAC GCGATGAGGT GGTGATCGCG ACCAAGGCGT TTTTGCCGTG GCGCGAGAGT 
CCAAATACCG GCGGTCTGTC GCGCAAGGCG CTGTTTCAGG CGATCGACGA CAGTCTGCGC 
CGGCTGGGCA TGGACTACGT GGACCTGTAC CAGATCCACC GCTGGGATTA CGAGACGCCG 
ATCGAGGAGA CCATGGAGGC GCTCCACGAC ATCGTGAAGG CCGGCAAGGC GCGCTACATC 
GGCGCCTCGT CGATGCGGGC GTGGGAGTTT TTCAAGGCCC AGAGCACGGC CGAGCGCCAC 
GGCTGGACCA AGTTCGTGGC CATGCAGAAC CACCTCAATC TGCTGTATCG CGAGGAGGAG 
CGCGAGATGA TGCCGCTGTG CGAGGACCTC GGGGTCGGCG TGATTCCCTG GAGTCCGCTG 
GCGCGCGGGC GCCTGGCGCG GCCGTGGGAC ACCCACACCG AGCGCTCGCA GAGCGACCGT 
TTTGGCAAAC GCATCTACGC GGCCACCGAG GACAACGATC GCGAGATCGT CGAGCGCGTG 
GGCGCGGTGG CCGGCGAGCG CGGGGTCTCG CGCGCGCAGG TCGCGCTGGC CTGGCTGCTG 
GGCACGCCGG CGGTGGCGGC GCCCATCATC GGCGCCTCCA AGCTCGCGCA CCTCGAGGAC 
GCGATCGCGG CGGTCGATGT CGAGCTGAGC GATGCGGAGC GCGAGCAGCT CGAGGCGCCG 
TATCGCCCGC ATCCGGTGGT CGGCCTGGCC GGTCCGCTGC CGCCGCCGAA GAGCGTGAGC 
GTGCTGGACT GA

Protein sequence

MKYTKLGNTG LTVSRICLGC MSYGEAGDGS SSLKHAWTLD EDTSRGFFRR ALEAGINFFD 
TANGYSEGSS EEFLGRAMQA LARRDEVVIA TKAFLPWRES PNTGGLSRKA LFQAIDDSLR 
RLGMDYVDLY QIHRWDYETP IEETMEALHD IVKAGKARYI GASSMRAWEF FKAQSTAERH 
GWTKFVAMQN HLNLLYREEE REMMPLCEDL GVGVIPWSPL ARGRLARPWD THTERSQSDR 
FGKRIYAATE DNDREIVERV GAVAGERGVS RAQVALAWLL GTPAVAAPII GASKLAHLED 
AIAAVDVELS DAEREQLEAP YRPHPVVGLA GPLPPPKSVS VLD