Gene Hoch_5072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5072
Symbol
ID	8547483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	6992525
End bp	6993592
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	71%
IMG OID	646389748
Product	polysaccharide deacetylase
Protein accession	YP_003269453
Protein GI	262198244
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGAACC GCGGCGAGCA TCTAGAAGCG CGAGGCGTAC GTGCGCGGCT CGCGCGCCCC 
GGGCTGTTCG CGCTCACCTT GACCCTGGCG CTGAGCTGCG CGGCGGCCTT GTGGGCGGCG 
CCGCCGACCG GCGTGGCCAG CGCCGCGCCC CGTCTCGACA ACGCCCACAC GGCGTCGCCG 
CAGCCCGCCG AGCCCGGTCT CGCGGGCGCC GCGGCACAGG CCGACGAGGA GTACGTGGAC 
CCGGACGAGC TCGGCGACTT CGACGACGGC GAGGCCGAGG AGGAGGAGCA CCGCGGCAGC 
GAGCAAGAGC GCCGCGGCTG GCCCCATCCC GCGGCCGGCA AGTCGGCCAG CGGCGGCCCC 
GAGGTGGTGT TCACCTTCGA CGACGGCCCG CATCGCAAGT ACACGGCCGA GATCCTCGAC 
GAGCTCCAGG AGCGCGACAT CCAGGCCATC TTCTTCTGGG TCGGCCACCG CGTCACCAAG 
GGCGGCGGCG TGGCCCAGCA GCGCGCCCTG GTCGAGCGCG CGGTGCGCGA GAATCACCTG 
GTCGCCAACC ACACCATCAC CCACGCCAAC CTGTGCCAGA TCCCGCGCGA CGAAGCCGCC 
CACGAGATCG ACGAGAACGG GCGCATCTAC GCGGAGCTGA GCGGCCTGCC GCTGCACCTG 
TTCCGCTCGC CCTACGGCGC CTACTGCCGC AATCTGGTCG GCCTGCTCGA GGAGCGCTCC 
ATGCAGCACA TGCACTGGGA CATCGACCCG CGCGAGTGGG AGCACCACAG CAAGGAGTGG 
GTGGTCAACT ACGTCACCAC GCGCCTGCGC CGTCTCGACG GCCGCGCCGT GGTGCTGCTG 
CACGACACCA AAGCCGCCTC GGCGCGCGCG CTGCCCGAGA TCCTCGACTG GATCGACAAG 
GAAAACCAGC GCCGCGACCA GCGCGGCAAC AAGCTGCCCA TCCGCATCCT GTCGGGCTCG 
GACCTATTGT TCGAGCGCAT CTCGCCCGGG CTGACCAGCT TCATCACCGC GACCGCCGAG 
CGCTCCGTGA GCGCGGTGGC CAACGCGGTG ACTCGCCTGG TCCCCTGA

Protein sequence

MKNRGEHLEA RGVRARLARP GLFALTLTLA LSCAAALWAA PPTGVASAAP RLDNAHTASP 
QPAEPGLAGA AAQADEEYVD PDELGDFDDG EAEEEEHRGS EQERRGWPHP AAGKSASGGP 
EVVFTFDDGP HRKYTAEILD ELQERDIQAI FFWVGHRVTK GGGVAQQRAL VERAVRENHL 
VANHTITHAN LCQIPRDEAA HEIDENGRIY AELSGLPLHL FRSPYGAYCR NLVGLLEERS 
MQHMHWDIDP REWEHHSKEW VVNYVTTRLR RLDGRAVVLL HDTKAASARA LPEILDWIDK 
ENQRRDQRGN KLPIRILSGS DLLFERISPG LTSFITATAE RSVSAVANAV TRLVP