Gene Hoch_5210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5210
Symbol
ID	8547622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	7164396
End bp	7165421
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	69%
IMG OID	646389885
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_003269589
Protein GI	262198380
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGCT ACCAGACCAT CTCGCAGCAG CTCGAGGCCG AGCCCAAGCG CTGGCTGATC 
ACCGGCGTGG CCGGCTTCAT CGGCTCGGCG CTGCTCGAGC GCTTGCTCGG GCTGGGCCAG 
GACGTCGTCG GCATCGACAA CTTCGCCACC GGCCACCAGC ACAACATCGA TGACGTGCTG 
TCGCAGTTCC CGGACGCGCG CTTCACCTTC GTGGAGGGCA GCATCACCGA CGGCGACGCC 
TGCAAGCGCG CGTGTGACGG CGTCGATTAC GTGCTGCACC AGGCCGCGCT GGGCTCGGTG 
CCGCGCTCCA TCAACGAGCC GCGGGCGTCG CATCACGCCA ACGTCAACGG CTTCCTCGAG 
CTGATGCTGT CGGCGCGCGA CGCCGGCGTC AAGCGCGCGG TCTACGCCAG CTCGAGCTCG 
GTGTACGGCG ACCATCCCGG GCTGCCCAAA GTCGAGGAGC GCATCGGCCG CCAGCTCTCG 
CCCTACGCCA TCACCAAGCG CGTGGACGAG CTCTACGCCG GCGTCATCCA GGACTGCTAC 
GGCACCGAGA TCATCGGCCT GCGCTACTTC AACGTGTTCG GCCGGCGCCA GGATCCGCTG 
GGCGCGTACG CGGCCGTGAT CCCGCGCTGG GTGGACGCGC TGCTAGGCGG CCGCGGCTGC 
CAGATCTTCG GCGACGGCAG CAACAGCCGC GACTTCTGCT ACGTGGACAA CGCGGTACAG 
GCCAACATCC TGGCCGCCAC CACCGGCGGC CCCGAGGTCA CCAACACCGT GTACAACGTC 
GGCTGCGGCG GGCGCACCAC GCTGGTCGAG CTGTTCGAGT ACATCCGCGA CGGCCTGGCC 
GAGATGCATC CCGAAGTCGC CGACGCGCAG CCCGAATTCA CCGAGCCGCG CGCCGGGGAC 
GTGCTGCACT CGCAGGCCAA TATCGACAAG ATCCGCGAGA AGCTCGGCTA CGAGCACACG 
CACGAGATTC GCGAGGGACT GCGCGAGACC GTGCACTGGT TCGCCGAGCG CGCGGGCAAG 
TCCTGA

Protein sequence

MTRYQTISQQ LEAEPKRWLI TGVAGFIGSA LLERLLGLGQ DVVGIDNFAT GHQHNIDDVL 
SQFPDARFTF VEGSITDGDA CKRACDGVDY VLHQAALGSV PRSINEPRAS HHANVNGFLE 
LMLSARDAGV KRAVYASSSS VYGDHPGLPK VEERIGRQLS PYAITKRVDE LYAGVIQDCY 
GTEIIGLRYF NVFGRRQDPL GAYAAVIPRW VDALLGGRGC QIFGDGSNSR DFCYVDNAVQ 
ANILAATTGG PEVTNTVYNV GCGGRTTLVE LFEYIRDGLA EMHPEVADAQ PEFTEPRAGD 
VLHSQANIDK IREKLGYEHT HEIREGLRET VHWFAERAGK S