Gene Hore_04820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_04820
Symbol
ID	7314461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	518050
End bp	519348
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	42%
IMG OID	643610905
Product	Beta-glucosidase
Protein accession	YP_002508235
Protein GI	220931327
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.0266886
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATTAA AACTACCACA GGATTTACTG CTCGGGGCAG CAACTTCAGC CCTGCAGATT 
GAAGGAGGAG ATAAAAATAA TAACTGGTAT CAGTGGTGTG AAGAGGGACA CATTAAAGAT 
GGGAGTCATT GCCTTAATGC CAACGATCAC TGGAATAGAT ACCGCGAAGA TATTGAACTT 
ATAAAAAAAC TGGGTCTTGA AACCTATAGA ATGGGGCTGG AGTGGAGTCG AATAGAGCAT 
CAGCCCGGTA AATTTAGTAA GGAAGGAATC GAACATTACC GTGATGAAAT TACCCTTCTC 
CTTGAAAATG GGGTTGTTCC CCTGGTGACC CTTCATCATT TTTCTCACCC CCTGTGGCTT 
GTTAATAAAG GGGGCTGGGG GAATAAAAAG GTAGTTGATT ATTTTAAGCG GTATACAGAG 
TATGTAGTCG AAAATCTGGG GGATCTGGTG AGTGACTGGA TTACCATTAA TGAACCCAAT 
GTCTTTCTCT ATAATGGATA TGTTGAAGGT ATCTGGCCTC CGGGAAAAAA CAATATTTTT 
TCTATGTTCA GGGCCATGAA GAATATGATA AAAGCCCATA TAGTCTCCTA TAAGACTATT 
CATCAGGTCA GGTCTAAACA TAATTTTGAG GGAGAAACAA GGGTTGGAGT TGCCAACCAT 
GTCAGACTGT TTGACCCGGC TGGAAATAAA AAAATACATG GAATACCGGC CCGCCTCCTT 
GATTACTTTT TTCACCGCCT GGTTATGGAA GGAATGGCCA GGGGAAAGTT TATGTTTCCC 
ATCGGTACCG GGGGACACCC CCTGGGGGAG GGGAGGTATT ATGACTTTAT CGGGATTAAT 
TATTATACCA GGGATATTAT TAAGTTTACC CTGAATCCGG CCTCCCTGTT TGCCAGGATG 
GAAGTTAAGG AAGGAGCAGA TACCAGTGAC CTCGGCTGGG AAATATATCC TGTGGGCCTG 
AAGAGGGTCT GTCGTAAATA TTATGAGGAA TATCAGGCCC CTGTATTTAT TACCGAAAAC 
GGTATTTGTG ATAAGGGGGA TACCAAAAGA GGGCACTTTA TCTATGACCA TTTAAAAGAA 
GTAGTAAAGC TGATTAATGA AGGTATTCCC GTTGAGAGGT ATTATTACTG GACTTTGATA 
GATAACTTTG AATGGATTGA AGGTGAAAGT GCCCGGTTTG GCCTGATCCA TAATGATTTT 
AAAACTCAGA AACGATCCAT CAGGATCAGT GGTTATTTTT ATGGGAAAAT ATGCAAGACA 
AAAGAGATTA CCCCCGAAAT GGAGAGAATT TATCTTTAA

Protein sequence

MSLKLPQDLL LGAATSALQI EGGDKNNNWY QWCEEGHIKD GSHCLNANDH WNRYREDIEL 
IKKLGLETYR MGLEWSRIEH QPGKFSKEGI EHYRDEITLL LENGVVPLVT LHHFSHPLWL 
VNKGGWGNKK VVDYFKRYTE YVVENLGDLV SDWITINEPN VFLYNGYVEG IWPPGKNNIF 
SMFRAMKNMI KAHIVSYKTI HQVRSKHNFE GETRVGVANH VRLFDPAGNK KIHGIPARLL 
DYFFHRLVME GMARGKFMFP IGTGGHPLGE GRYYDFIGIN YYTRDIIKFT LNPASLFARM 
EVKEGADTSD LGWEIYPVGL KRVCRKYYEE YQAPVFITEN GICDKGDTKR GHFIYDHLKE 
VVKLINEGIP VERYYYWTLI DNFEWIEGES ARFGLIHNDF KTQKRSIRIS GYFYGKICKT 
KEITPEMERI YL