Gene Hoch_3943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3943
Symbol
ID	8546339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	5437145
End bp	5438155
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	77%
IMG OID	646388615
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_003268335
Protein GI	262197126
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0142481
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00944074
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTGGCCC TGTGGCTCGA AGACCGCGCG CTGCGGCTGC GCGATGACCT GCCGGTGCCC 
GCGCCCGGCC CCGGCGAGGC GCGCGTGCGC GTGCTGCGCG CCGGCATCTG CGCCACGGAT 
GTCGAGCTTG TGCGCGGCTA CTATCCGTTC ACCGGCGTGC CCGGCCACGA GTTCGTCGGC 
GTGGTCGACG CGCTCGGCCC CGCGACCGAC GACGGTGCAG CGGACCCGGG CGACGACGAC 
GACGACGACG GGGGCTGGCT TGGGCGCCGC GTGGTCGGCG AGATCAACGT GGTCTGCGGC 
GCCTGCGCGC AGTGCCGGGC GGGCCGTCGC ACGCACTGCA CGCGCCGGCA AGCGCTCGGC 
ATCCACGGCC GCCACGGCGC CTTCGCCGAG TACCTGTGCC TGCCGCTCGC CAACCTGCTC 
GCGGTCCCCG ACGAGCTGAG CAGCGACGCG GCCGCGTTCA CCGAGCCGCT GGCGGCCGCG 
CTCGAGCTCC AGGAGCAGGT CGCGCTGCGC CCCGGCGCGC GCGTGCTCGT GGTCGGCGCC 
GGCAAGCTGG GCCAGCTCGT GGCCCAGAGT CTGGCGCTGA GCACGGCCCA GGTGCGCGTG 
GTGTGCCGCT CGGCGCAGCG CCGCGCACCG CTCCACGCGC GCGGCATCGC CACCTGCGCG 
CCCGACGAGG TCCGCGCCGG CTGCGCCGAC CTGGCCGTGG AGTGCAGCGG CCACCCCGAC 
GGCTTCGCGC TGGCCCGGCG CGCGCTGCGG GCGCGCGGCA CCCTGGTGCT CAAGAGCACC 
TACGCGGGCG CTCTGACCAT AGACGCCTCG TCGCTCGTGG TCGACGAGCT GACCGTGGTG 
GGCTCGCGCT GCGGTCCCTT CGCGCCGGCC CTGCGCCTGC TCGCCAGCGG CCGCATCGAC 
CCGATGCCGC TGGTGAGCGC GCGCTTCCCG CTGCGCGAGG CGCTGGCCGC CTTCGACGCG 
GCGCGCGCGC CCGGCGCCTT CAAAGTCCTG CTGGCCGCCG ACGCCGCCTG A

Protein sequence

MLALWLEDRA LRLRDDLPVP APGPGEARVR VLRAGICATD VELVRGYYPF TGVPGHEFVG 
VVDALGPATD DGAADPGDDD DDDGGWLGRR VVGEINVVCG ACAQCRAGRR THCTRRQALG 
IHGRHGAFAE YLCLPLANLL AVPDELSSDA AAFTEPLAAA LELQEQVALR PGARVLVVGA 
GKLGQLVAQS LALSTAQVRV VCRSAQRRAP LHARGIATCA PDEVRAGCAD LAVECSGHPD 
GFALARRALR ARGTLVLKST YAGALTIDAS SLVVDELTVV GSRCGPFAPA LRLLASGRID 
PMPLVSARFP LREALAAFDA ARAPGAFKVL LAADAA