Gene Hoch_1250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1250
Symbol
ID	8543632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	1641481
End bp	1643415
Gene Length	1935 bp
Protein Length	644 aa
Translation table	11
GC content	67%
IMG OID	646385968
Product	glycoside hydrolase family 3 domain protein
Protein accession	YP_003265703
Protein GI	262194494
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTCC CGATCTCCAT TCGTTCCTTT GCCAGGCGCC CCGGACTGCT CATTGTCCAG 
ACAGCCCTGC TCGCGGCCGG CCTCGCGGCC TGCACCGATA TCGCACCGGA AGCCGGCAAC 
AGCGGCGACA AGACCCAGCA CACCGCTCAG GATGAGCGCG CGCTAGCATC AACTGCGCTG 
TATCAAGATC CCGCGGCGGC GATTCCCGAT CGCGTGGCCG ACCTGCTGGC GCGCATGAGC 
CTCGACGAGA AGATCGGACA GATGACCCAG GTCGAGCGCT CGTCGCTGCA ATCCGATCAG 
GATCTCGCCG CCTATCATAT TGGCTCGCTG CTCAGCGGCG GCGGTTCGGC GCCGGCGTCG 
AACACACCGA GCGCGTGGGC CGACATGGTC GACGGCTATC AGAGCGTCTC CATGAGCACG 
CCGCTGGGCA TTCCTCTGCT GTACGGAATC GACGCCGTCC ACGGCCACAA CAACGTCGTC 
GGCGCGACCA TCTTCCCGCA CAACATCGGA CTCGGCGCCT CGCGCAATCC CGCGCTCGCC 
GAGGAGATCG GCCGCATCAC GGCCAAAGAG GTGTACGCCA CCGGCATCCG CTGGGACTTC 
GCGCCCACGC TGTGCGTCGG CCGTGACGAG CGCTGGGGCC GCACCTATGA GTGCTTCGGC 
GAGCATCCCG AGGTGCCGGC GATGATGAGC TCGTTCATCG ACGGCTTGCA GGGCACGTAC 
AGCGGCGGCG CCGGTCTGTC GGGACGCAAC GGCGTGCTGG CCACGGCCAA GCACTGGGTC 
GGCGACGGCG GCACGAGCTG GGGCACCGGC GAGGGTTCCT ACCAGATCGA CCAGGGCGAC 
ACCCAGGTGA GCGAGGCCGA GCTGCGCGAC GTGCACATCG CGCCCTATCA CGACGCCATC 
GCGCGCAACG TCGGCAGCGT CATGCCCTCG TACTCGAGCT GGAACGGCGA GAAAATGCAC 
GGCCACGCGT ATCTCATGGG CGACGTGCTG CGCGACGAGA TGGGCTTCGA CGGCTTCGTT 
ATTTCGGACT GGCAGGCCAT CGACCAGATC CCGGGCGACT ACGCCAGCGA CGTGCGCACA 
TCGATCAACG CCGGCGTCGA CATGGTCATG GTGCCGCACG ATTACATCAC CTTCCAGAAC 
ACGCTGCGCA ACGAGGTCAA CGCCGGCAAC GTGTCGCTGG CCCGCATCGA CGAGGCCGTG 
AGCCGCATCC TCACCAAGAA GTTCGAGCTC GGCCTGTTCG AGCAGCCGTA TTCTGACCGC 
ACGCACCTCG CCGAGCTCGG CTCGGCCGCT CACCGCGAGG TGGCGCGCCG CGCGGTGCGC 
GAGTCGCTGG TGCTGCTCAA GAACGACGGC ACCCTGCCGC TGGCCAAGGA TCCGCAGAAA 
ATCCTGGTCG CGGGCAAAAG CGCCGATGAT ATCGGCCTGC AATCGGGCGG CTGGACGATC 
TCGTGGCAGG GTGCGGCCGG CGACATCACG CCGGGAACCA CGGTCCTCGA GGCGGTGCGC 
GCCACGGTCG CGCCGTCCAC CACGGTCGAG TTCAAGCAGC GCCCCAACGG CCGCCTGAGC 
GGCGATGTCG GCATCGTCGT GGTCGGCGAG ACGCCCTACG CCGAGGGCCG CGGCGACAAC 
AACAGCCTCA GCCTGGCGGT GGAAGACCGC AACGCCATCA AGAACGTGTG CGGCGCCATG 
CCGTGTGTGG TGGTGCTGAT CTCGGGTCGG CCGATGATGC TCGAGGGCGA GCTGGACAAG 
ATCGACGCGC TGGTGGCCGC GTGGCTGCCG GGCACCGAGG GCCAGGGCGT CGCCGATGTG 
CTGTTCGGCG ACTTCGACTT CAGCGGCACG CTGCCGCTGT CGTGGCCGCG CACCATCAAC 
CAGGTGCCGA TCAACGTCGG CGATGCCTCC TACGACCCGC TCTTCGCCTA CGGCTTCGGC 
CTCAGCTATC AGTAG

Protein sequence

MTLPISIRSF ARRPGLLIVQ TALLAAGLAA CTDIAPEAGN SGDKTQHTAQ DERALASTAL 
YQDPAAAIPD RVADLLARMS LDEKIGQMTQ VERSSLQSDQ DLAAYHIGSL LSGGGSAPAS 
NTPSAWADMV DGYQSVSMST PLGIPLLYGI DAVHGHNNVV GATIFPHNIG LGASRNPALA 
EEIGRITAKE VYATGIRWDF APTLCVGRDE RWGRTYECFG EHPEVPAMMS SFIDGLQGTY 
SGGAGLSGRN GVLATAKHWV GDGGTSWGTG EGSYQIDQGD TQVSEAELRD VHIAPYHDAI 
ARNVGSVMPS YSSWNGEKMH GHAYLMGDVL RDEMGFDGFV ISDWQAIDQI PGDYASDVRT 
SINAGVDMVM VPHDYITFQN TLRNEVNAGN VSLARIDEAV SRILTKKFEL GLFEQPYSDR 
THLAELGSAA HREVARRAVR ESLVLLKNDG TLPLAKDPQK ILVAGKSADD IGLQSGGWTI 
SWQGAAGDIT PGTTVLEAVR ATVAPSTTVE FKQRPNGRLS GDVGIVVVGE TPYAEGRGDN 
NSLSLAVEDR NAIKNVCGAM PCVVVLISGR PMMLEGELDK IDALVAAWLP GTEGQGVADV 
LFGDFDFSGT LPLSWPRTIN QVPINVGDAS YDPLFAYGFG LSYQ