Gene Hoch_1849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1849
Symbol
ID	8544231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	2546828
End bp	2547823
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	71%
IMG OID	646386555
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_003266290
Protein GI	262195081
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1087] UDP-glucose 4-epimerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.216355
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCGA CTCCATCTCA GCCCCCCTTC GTGGCGGTGA CCGGCGGCGC CGGCTTCATC 
GGTTCGCACA CCGTGGACCG CCTGCTGGCC GCCGGCTGTC GCGTGGTCGT GCTCGACAAC 
CTCAGCACCG GCAAGCGCGA GAACCTGGCC CAGCACGCGG GCGAGCCCCG CTTCCACCTG 
GTCGAGACCG ACATCGCCGA CGGCCTGTTC GCGCCCCTGG CCGCGCTCAC CGACGAGCAC 
GGGCCGGTGC AGCGCATCAT CCACCTGGCG GCGCAGACCT CGGTGGTGCG CTCGGTCGAG 
CAGCCGCTGC ACGACATCCG CATCAACTAC GCGGGCACCG CCCAGGTGCT CGAGTACGCG 
CGCCATCGCG GCGTGGCCAA GGTGGTGCTG GCGTCATCGG CCGCGGTCTA CGGCGACACC 
GAGGAGCTGC CGGTGCGCGA GACCCTGCCC ACGCGCCCGC TGTCGCCCTA CGGCGCCAAC 
AAGCTCGGCA GCGAGCAGCT TCTCTACTAC TACTCGGCCG TGCACGGCGT CGGCACCACG 
GCGCTGCGCT TCTTCAACGT CTACGGCCCG CGCCAGGACC CCAAGAGCCC GTACTCGGGA 
GTGATCTCGA TCTTCGCCGA TCGCGCCATG GCCGGCAAGC CGCTCACCAT CTTCGGCGAC 
GGCGAGCAGA CCCGCGATTT CGTCTACGTC GGCGATGTGT CGCGGGCCGT GGCTCAGGCC 
TGCCTGGGCG ACGAGGGCGA CCGCGCGATC ATCAACATCG GCACCGGCAG CGAGACCACG 
GTCAACGAGC TGGCGCGCAC CATCGTCTCG CTGTGCGGCG AGGCCGCGGG CGCGCCCGAG 
GTCGCCATCT CTCATTCGGA CGCCCGTCCG GGCGAGATCG CGCGCTCGGT GGCCGCGGTC 
GAGCGCATGC GCGATATTCT GGGCCTGCGC GCCGAGACCG AGCTGGCCGC CGGGCTGCGC 
GAGACCCTGG CCTGGATCCG CAGCGCGGAC GCCTGA

Protein sequence

MSSTPSQPPF VAVTGGAGFI GSHTVDRLLA AGCRVVVLDN LSTGKRENLA QHAGEPRFHL 
VETDIADGLF APLAALTDEH GPVQRIIHLA AQTSVVRSVE QPLHDIRINY AGTAQVLEYA 
RHRGVAKVVL ASSAAVYGDT EELPVRETLP TRPLSPYGAN KLGSEQLLYY YSAVHGVGTT 
ALRFFNVYGP RQDPKSPYSG VISIFADRAM AGKPLTIFGD GEQTRDFVYV GDVSRAVAQA 
CLGDEGDRAI INIGTGSETT VNELARTIVS LCGEAAGAPE VAISHSDARP GEIARSVAAV 
ERMRDILGLR AETELAAGLR ETLAWIRSAD A