Gene Hoch_0554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_0554
Symbol
ID	8542934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	746813
End bp	747838
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	67%
IMG OID	646385348
Product	aldo/keto reductase
Protein accession	YP_003265085
Protein GI	262193876
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.243293
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATATC GGAATCTGGG CGCCAGTGGC TTGAAGGTCT CCACGCTGTG TCTGGGCGCC 
ATGACCTTTG GCGAAGCCGA CGAAAGCTCG TTCATGCACA ACGTGAGCTG CGACGAGGAG 
ACCTCGTTTC AGATCATGAA TCGCGCCCTC GACCTGGGCG TGAACTTCAT CGATACGGCC 
GACGTGTACG GCCAGGGCGG CCTCTCCGAG CGCGTCATCG GCAAGTGGTT CGCGCAGGAC 
GGACGCCGCG ACGAGGTCGT GTTGGCGACC AAGTTTCGCT TCCGCATGGG CCAGGGCCCC 
AACGGCACCG GCGCCGCCCG CTACCGCATC GTCAAGACCG TGGAGGACAG CCTGCGCCGC 
CTCGGCACCG ACCGCATCGA TCTCTATCAG ATCCACATGC AGGACATCGA CACGCCCGAG 
GAGGAGACCC TGCGCGCGCT CGACGACCTG GTGCGCCAGG GCAAGGTGCT CTACCTCGGC 
TGCAGCAACT ACGCCGCCTA CCGCCTGGTC CACAGCCTGT GGACCAGCAA GACCCAGCTC 
CTCGAGCGCT TCGTGGCGCT GCAGGCGCAG TACAGCCTGG TGGTGCGCGA CCTCGAGCGC 
GAGCACGTGC CGGTGTGTCG CGATTTCGGC CTCGGCATCC TGCCCTGGTC GCCGCTCGCC 
GGCGGCTTCC TCACCGGCAA GTACCACAAG GACCAAGAGC CGCCCGAGGG CAGCCGCCTC 
GAGACCTGGA AAGATCGCTA CGCCGGCTTC GACAGCCCGC GCAACTGGCG CATCCTCGAG 
GCCGCCGAGA AGGTCGCCGG CGAGCTGAAA GCCTCTGTGG CCCAGGTGTC GCTGGCGTGG 
CTGCTCAGCA AGCCCACCGT GAGCTCGGTG ATCTTTGGCG CGCGCACGGT CGAGCAGCTC 
GAGGACAACG TCAAGGCCGC CGAAGTGACG CTGAGCGCCG AGCAGGTGGC CGCGCTCGAC 
GAGGCCTCGG ACTTCGACCT CGGCTATCCC TACCAATTCC TGGGCAACGT CCAGAGCCGC 
TGGTAG

Protein sequence

MEYRNLGASG LKVSTLCLGA MTFGEADESS FMHNVSCDEE TSFQIMNRAL DLGVNFIDTA 
DVYGQGGLSE RVIGKWFAQD GRRDEVVLAT KFRFRMGQGP NGTGAARYRI VKTVEDSLRR 
LGTDRIDLYQ IHMQDIDTPE EETLRALDDL VRQGKVLYLG CSNYAAYRLV HSLWTSKTQL 
LERFVALQAQ YSLVVRDLER EHVPVCRDFG LGILPWSPLA GGFLTGKYHK DQEPPEGSRL 
ETWKDRYAGF DSPRNWRILE AAEKVAGELK ASVAQVSLAW LLSKPTVSSV IFGARTVEQL 
EDNVKAAEVT LSAEQVAALD EASDFDLGYP YQFLGNVQSR W