Gene Hoch_2331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2331
Symbol
ID	8544717
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	3238746
End bp	3239735
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	67%
IMG OID	646387035
Product	aldo/keto reductase
Protein accession	YP_003266766
Protein GI	262195557
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.196419
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.2019
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGAC GCAAGCTCGG GGCAGAGGGT CCCGAAGTCT CCGCGCAAGG CCTGGGATGC 
ATGGGCATGA GCGCGTTTTA CGGAAACGGC GACGACGCTG AATCGATCGC CGTCATGCAC 
CGAGCGCTCG AGCTGGGCGT GAATTTTTTC GATACTGCGG ACATGTATGG CCCTCACACC 
AACGAGAAGT TGGTGGGCCG CGCGATCGCC GATCGCCGCG ACCAGGTCTT CCTGGCCACC 
AAGTTCGGCA TCGTCTTCGA CCCCGAGCGT CCGCGCGAGC GCAGCATCGA CGGCTCGCCC 
GCGTACCTGC GCAACGCCTG CGACGCCAGC TTGCAACGGC TCGGTGTCGA CCACATCGAC 
CTCTACTATC AGCACCGGGT GGACGCGAAT GTCCCCATCG AGGAGACGGT CGGCGCCATG 
GCCGAGCTGG TCAAGGCCGG CAAGGTTCGC TACCTCGGCC TATCCGAGGC CGGCCCCAAG 
ACCCTGCGGC GCGCTTGCGA GGTCCACCCC ATCACCGCCT TGCAGACCGA ATACTCGCTG 
TGGAGCCGCG ATCCCGAGGA CGAGATCCTG GCCACCTGCC GCGAGCTCGG CGTCGGCTTC 
GTCGCCTACA GCCCGCTCGG ACGCGGCTTC CTCACCGGCC AGATCACCTC GCCCAGCGAC 
CTCGCCGAAG ATGACTGGCG CCGTCACAGC CCGCGCTTTC AGGGCGAGAA CTTCGCAAAG 
AATCTCGCCA TGGTGTCCAA AATCCAGGAG ATCGCCGCGG AGAAGGGCTG CACCGCGGCG 
CAGCTCGCGC TGGCCTGGGT GATGGCCCAG GGCGACGACA TCGTGCCCAT CCCGGGGACC 
AAGCGCAAAC ACTACCTCGA GGACAACGCC GGCGCGTGCG AGCTCGCGCT GAGCGACGAG 
GACAAGGCGC GCATCGAAGC CGTGGCCCCG CCCGGCGCCG CGGCCGGCAC GCGCTACCCC 
GAGGCCTTGA TGAAGGGCGT CAGCACCTGA

Protein sequence

MKRRKLGAEG PEVSAQGLGC MGMSAFYGNG DDAESIAVMH RALELGVNFF DTADMYGPHT 
NEKLVGRAIA DRRDQVFLAT KFGIVFDPER PRERSIDGSP AYLRNACDAS LQRLGVDHID 
LYYQHRVDAN VPIEETVGAM AELVKAGKVR YLGLSEAGPK TLRRACEVHP ITALQTEYSL 
WSRDPEDEIL ATCRELGVGF VAYSPLGRGF LTGQITSPSD LAEDDWRRHS PRFQGENFAK 
NLAMVSKIQE IAAEKGCTAA QLALAWVMAQ GDDIVPIPGT KRKHYLEDNA GACELALSDE 
DKARIEAVAP PGAAAGTRYP EALMKGVST