Gene Hoch_2003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2003
Symbol
ID	8544385
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	2763553
End bp	2764863
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	69%
IMG OID	646386706
Product	Glucose/sorbosone dehydrogenase-like protein
Protein accession	YP_003266441
Protein GI	262195232
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.528812
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTCCT CGTCATTTGC CCCACGTCCC GATCAACCTA CCGCGGGCGT GCGATTCGGA 
CACCTGGACT CGATCCGCCG CTCGCTGGCG ACTGCCCGCG CGCTGCCGGT GATTGCCATT 
CTGGCGCTGC TCGGCGGCGG CTCCAGTTGT CGCACGAACA ACCCCGCCGA CGAGATCCCG 
CCGCCGCCGA CGCCGCCGCC GACAACAAAG GCGACGGCAA CGCCGGAGTC GGCGGAGACG 
GAGGAGACGG CGGAGACGGC GATGATCAGC GCGCTCGGCG GCAAGCTGCG CGTGCCCAAG 
GGCTTCCGCG TCGAGGTCTT CAGCAAGGAG GTGCCCAACG CCCGCGGCAT GGCGCTGGGC 
CCCGAGGGCA CGCTGTTCGT GGGCTCGCGC CAGGCCGGCA AGGTCTACGC GGTGGTCGAC 
GAGGACGGCG ACGGCCGCGG CGACCGCGTG CACACCATCG CCGAGGGCCT GCAGATGCCC 
GTGGGCCTCG ATGTCCGCGA CGGCGCTCTG TACGTGTCGG CGACCGATCG CGTGCTGCGC 
TTCGACGGCA TCGAGACCAA GCTCGACAGC CCGCCGACCC CGGCCGTGGT CTCCGAGGCC 
TTTCCCGACG ACACCCACCA CGGCTGGAAG TTCATCCGCT TCGGCCCCGA TGGCTGGCTC 
TACGTGCCCG TGGGCGCGCC CTGCAACATG TGCCTCGAAG AGGACGAGCG CTACGCTAGC 
ATCATGCGCA TGAAGCCCGA CGGCAGCGCG CTCGAGGTCT ACGCTCACGG CGTGCGCAAC 
ACCGTGGGCT TCGACTGGCA CCCCGAGAGC GGCGCCATGT ACTTCACCGA CAACGGCCGC 
GATATGCTCG GCGACGACCT GCCGCCCGAC GAACTCAACC GCGCGTCCGA AAAAGGCCAG 
CACTTCGGCT ACCCCTTCTG CCACGCCGGC ACCATCGCCG ATCCTGAGTT CGGCGAGCAG 
CGGCCGTGCC GCGAGTTCGT GCCCCCGGTG CAGAAGCTCG GGCCGCACGT GGCCGCGCTG 
GGCATGCGCT TCTACACCGG CACGCAGTTC CCGGCCGAGT ACCGCGGCGC CATCTTCCTC 
GCTGAACACG GCTCGTGGAA TCGCTCTGAG CCCATCGGTT ACCGCGTGAG CGTGGTCAAG 
CTCGACGGTG AGGGCAACGC GACCAGCTAC GAGCCCTTCG TCGAGGGCTG GCTGCGCGAG 
GGGGAGGCCT GGGGACGGCC CGTGGACGTG CTGGTCATGC CCGATGGCGC GCTGCTGATC 
TCCGACGATC GAGCTGGTTG GATCTATCGC GTCAGCTACG AGGCCGGTTG A

Protein sequence

MRSSSFAPRP DQPTAGVRFG HLDSIRRSLA TARALPVIAI LALLGGGSSC RTNNPADEIP 
PPPTPPPTTK ATATPESAET EETAETAMIS ALGGKLRVPK GFRVEVFSKE VPNARGMALG 
PEGTLFVGSR QAGKVYAVVD EDGDGRGDRV HTIAEGLQMP VGLDVRDGAL YVSATDRVLR 
FDGIETKLDS PPTPAVVSEA FPDDTHHGWK FIRFGPDGWL YVPVGAPCNM CLEEDERYAS 
IMRMKPDGSA LEVYAHGVRN TVGFDWHPES GAMYFTDNGR DMLGDDLPPD ELNRASEKGQ 
HFGYPFCHAG TIADPEFGEQ RPCREFVPPV QKLGPHVAAL GMRFYTGTQF PAEYRGAIFL 
AEHGSWNRSE PIGYRVSVVK LDGEGNATSY EPFVEGWLRE GEAWGRPVDV LVMPDGALLI 
SDDRAGWIYR VSYEAG