Gene Hoch_5231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5231
Symbol
ID	8547643
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	7189507
End bp	7191033
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	72%
IMG OID	646389905
Product	Aldehyde Dehydrogenase
Protein accession	YP_003269609
Protein GI	262198400
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.752485
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.244998
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGAGA CCAAGCAGGG CGCGACGCGC GCGCAACTCG AGAGCCGCGA TCCCCGCACC 
CACGAAGTGC TCGGGACGGT TCCCATTCAC AGCGAGGACG ACGTCCGCGC CGCGGTGGCG 
CGCGCGCGGC AGGCGGCCGC CCAGTGGGGG GCCCTGGATG TGAGCGCGCG GGCGAGCGCG 
CTCGACGGTT TTCGGCGCGC GCTGGCGGCC CAGGCCGAGG AGCTGGCCGA TCTCATCCAC 
CGCGAGAACG GCAAACCGCG TTTCGACGCG CTGATGGAGG TGTTCCTCGC GCTCGCGCAT 
CTGGCGCACA CCGCCGAGCG CGCCGGCAAA GCGCTGGCGC CGCGGCGCGT GAGCCCGGGC 
CTGTTCGCCA ACATCCGCGC CGCCATCCAC TACCATCCGC TCGGCGTCAT CGGCGTCATC 
GGACCGTGGA ACTATCCGAT GTTCACGCCC ATGGGCTCGA TCGGCAGCGC GCTAGCCGCG 
GGCAACGCGG TGGTGCTCAA GCCCTCGGAG CTCACGCCCC TGGTCGGCGT ACGCCTGGCC 
GAAATAGCCG CCAGCTCGCT GGGTAACGCG GATCTCGTAC AGGTGGTCAC CGGCGCCGGC 
GAGACCGGGG CAGCGCTGGC GCGCTCGGGC GTGGACAAGC TGTCGTTCAC CGGCTCGACC 
GCCACCGGGC GCAAGGTCAT GGCCGCCGCG GCCGAGACGC TCACGCCGGT GCTGCTCGAG 
CTGGGCGGCA AAGACGCCAT GATCGTAGCC GCCGACGCCG ACATCGAAGA GGCCGCGCAG 
GCGGCTGTGT GGGGCGCGTT TAGCAACGCC GGCCAGACCT GCATCTCGAT CGAGCGCGCC 
TACGTGGCCG CGCCGGTCTA CGATGCCTTC GTCGACCGGG TGGTCGAAAT CGCTCGCGAG 
GTACGCGCCG GCGAGGACAT CGGGCCGATG ACCAACGCCG CGCAGAGCGA TATCATCGCC 
GGCCAGCTCC GCGAGGCGGT GGCCGCGGGC GCGCGTCCCC TGGTCGGCGG CCCCGAGGCC 
ATGGCCGACG GCTTCGTCTC GCCCACGGTG CTGGTCGATG TCAGCGACGA TATGAGCATC 
ATGCGCGAGG AGACCTTTGG CCCGGTGCTG CCGATCGCGC GCGTGGCCGA CGCCGAAGAG 
GGCGTGCGCC GCGCCAACGC CTCGATGTAC GGGCTGGGCG GCGCGGTCTT TGGCAAGCAG 
GGCGTGCGCA CGCTGGCCTC GCGCCTGCGC GCCGGTGCCA CCGCGGTCAA CGCCGTCTTG 
GCCTTCGCCG GCGTGCCCTC GCTGCCCTTT GGCGGCGTCG GCGACTCGGG TTTCGGCCGC 
ATCCACGGCG ACGAGGGGCT GCGCTCGTTC TCGCGCACCC ACGCGGTCGC CGAGGCCCGC 
TTCGGCCTGC CCAAGTCGTT TGACCTGATG CGCTTCCACC AGCCCGAGAA CACCTTCGAG 
CGCATGCTCG GGCTCATCGA GCAGCTCTAC GGTGGCGGCG CCGTGGACAC CGCCAGCTCG 
CTGCTGCGTC GCCTGCGGCC CTGGTAG

Protein sequence

MAETKQGATR AQLESRDPRT HEVLGTVPIH SEDDVRAAVA RARQAAAQWG ALDVSARASA 
LDGFRRALAA QAEELADLIH RENGKPRFDA LMEVFLALAH LAHTAERAGK ALAPRRVSPG 
LFANIRAAIH YHPLGVIGVI GPWNYPMFTP MGSIGSALAA GNAVVLKPSE LTPLVGVRLA 
EIAASSLGNA DLVQVVTGAG ETGAALARSG VDKLSFTGST ATGRKVMAAA AETLTPVLLE 
LGGKDAMIVA ADADIEEAAQ AAVWGAFSNA GQTCISIERA YVAAPVYDAF VDRVVEIARE 
VRAGEDIGPM TNAAQSDIIA GQLREAVAAG ARPLVGGPEA MADGFVSPTV LVDVSDDMSI 
MREETFGPVL PIARVADAEE GVRRANASMY GLGGAVFGKQ GVRTLASRLR AGATAVNAVL 
AFAGVPSLPF GGVGDSGFGR IHGDEGLRSF SRTHAVAEAR FGLPKSFDLM RFHQPENTFE 
RMLGLIEQLY GGGAVDTASS LLRRLRPW