Gene Hore_04180 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_04180
Symbol
ID	7314093
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	440197
End bp	442053
Gene Length	1857 bp
Protein Length	618 aa
Translation table	11
GC content	43%
IMG OID	643610841
Product	beta-N-acetylhexosaminidase
Protein accession	YP_002508171
Protein GI	220931263
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	68
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAGAC TAGCCGGCTT TAGTCTTCTG TACATGGTGC TGTTGATTTG TTTTATAGGG 
GGAACTGTTT TTGCGTCTAC TGAATTAGTC GAAAATGAAG AGTTTAAGAT AATACCAGAT 
TATATGAACC CCTTTTTATC TATTGAGGAA AAGGTTGACA AACTTCTATC TGTGATGACC 
CTGGAAGAAA AAATAGGACA GATGACCCAG GCCGAACGAA GATATATAAC ACCGGATGAA 
GTTTATCAGT ACAAAATTGG TTCTATTTTG AGTGGTGGGG GTTCGACACC ATTTTCTAAT 
ACACCTGAAG CCTGGGCTAA CATGTATGAC AGATTTCAGA AGTGGGCCAT GAAGACCAGG 
CTAAAGATAC CAATAATCTA TGGTGTAGAC GCAGTCCATG GACATAATAA CCTCAGGGGG 
GCGACCATCT TTCCCCATAA CATTGGCCTT GGGGCCACCC GGGATCCTGA ACTGGTGGAA 
AAGGTAGGTA GAATTACTGC CAAAGAGGTT TCAGCCACTG GACCTGACTG GAATTTTGGT 
CCCTGTGTGG CAGTGGCCCG GGATGAGAGA TGGGGCAGAA CCTACGAAAG TTTCGGAGAG 
CATCCAGAAT TACAAAAATT ACTGGCCGGG GCCTATGTCA GGGGGTTACA GGGTCCAGAG 
GCAGAGATGG ATGGAGAATA TGTGGTGGCC TGTGCCAAGC ATTATGTTGG TGATGGTGGA 
ACTGAATGGG GAAGTGGTGA TGGAGGATAT TTAATTGACC GTGGCGACGT TACTGTTGAT 
GAAAAAACCT TACGTGAAAT CCACCTTCCA GGTTATATTG AAGCTATTGA AGAAGGTGTC 
GGTACCATTA TGGTATCATT TAACAGCTAT CAGGGAGTAA AAATGCATGC CCATAAATAC 
CTGATTACTG ATGTCTTAAA AGGTGAGCTG GGTTTTGACG GATTTGTTGT TTCGGACTGG 
AACGGAATCA ATGAGATATC AGGCTACAGT TATTATGAAA AAGTAGTTAA GTCAGTTAAT 
GCCGGAATTG ATATGTTTAT GGTGCCTGAT AGCTGGAAGA AATTTATTTA TAACCTTAAG 
CAGGCTGTAG AAAATGGAGA TGTAAGTGAA GAGAGGATTA ATGATGCGGT ACGGAGAATC 
TTAACCGTCA AATTCAAAGC AGGTTTATTT GAAAAACCCT TTACTGATCG TAGCCATATC 
TCCCTGATTG GCTCAGAAGA ACACCGTGAG GTAGCCCGGG AAGCAGTTCG AAAATCCCTG 
GTTCTATTGA AAAATGAAAA TGTTCTACCC CTGGATAAGG ATAGTAAAAT TTATGTAGGT 
GGTTCCAATG CCGAAGACAT TGGGAGTCAG TGTGGGGGCT GGACTATAAC CTGGCAGGGA 
CGTTCCGGTG ATATTACTGA AGGGACCACA GTTCTGGAAG GTATTGAAGC AGCTATTGCT 
GGCCGGGGTC AGGTTGTAAA TGATTTAAAT CAAGCTGATG TAGCGGTAAT AGTAGTAGGA 
GAAGACCCTT ATGCTGAAGG CCGGGGGGAT AATGGAAGGC TGGAATTGAA ACAGGAAGAT 
ATCAGCCTGC TAGAAAAGGT CACCGGGGCC GGAAAACCGG TTGTAGTAGT TATGATTTCC 
GGTAGACCTT TGATTATAAG TGATTATATC GATGACTGGG ATGCTTTTGT AATGGCCTGG 
TTACCTGGCA CAGAAGGTCA GGGTATAGCT GATGTGTTAT TCGGTGATTA TAATTTTACT 
GGTAGATTAC CTGTTTCCTG GCCAGAAGAT GTTTCTCAGT TACCCATAAA TTATGGGGAT 
GATGATTATG ACCCCTTATT CGAATATGGT ACTGGCCTTA AAATGGACCT TGAGTAA

Protein sequence

MKRLAGFSLL YMVLLICFIG GTVFASTELV ENEEFKIIPD YMNPFLSIEE KVDKLLSVMT 
LEEKIGQMTQ AERRYITPDE VYQYKIGSIL SGGGSTPFSN TPEAWANMYD RFQKWAMKTR 
LKIPIIYGVD AVHGHNNLRG ATIFPHNIGL GATRDPELVE KVGRITAKEV SATGPDWNFG 
PCVAVARDER WGRTYESFGE HPELQKLLAG AYVRGLQGPE AEMDGEYVVA CAKHYVGDGG 
TEWGSGDGGY LIDRGDVTVD EKTLREIHLP GYIEAIEEGV GTIMVSFNSY QGVKMHAHKY 
LITDVLKGEL GFDGFVVSDW NGINEISGYS YYEKVVKSVN AGIDMFMVPD SWKKFIYNLK 
QAVENGDVSE ERINDAVRRI LTVKFKAGLF EKPFTDRSHI SLIGSEEHRE VAREAVRKSL 
VLLKNENVLP LDKDSKIYVG GSNAEDIGSQ CGGWTITWQG RSGDITEGTT VLEGIEAAIA 
GRGQVVNDLN QADVAVIVVG EDPYAEGRGD NGRLELKQED ISLLEKVTGA GKPVVVVMIS 
GRPLIISDYI DDWDAFVMAW LPGTEGQGIA DVLFGDYNFT GRLPVSWPED VSQLPINYGD 
DDYDPLFEYG TGLKMDLE