Gene Hore_21810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_21810
Symbol
ID	7313729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	2371686
End bp	2372810
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	41%
IMG OID	643612634
Product	chitinase
Protein accession	YP_002509922
Protein GI	220933014
COG category	[R] General function prediction only
COG ID	[COG3858] Predicted glycosyl hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAGTAT CTCCGGTTAT ATACTGTGCT GCAACATCCA GTGAAGAAGG CCCCGGTACT 
TTTGACTGGT TAAAAGGTAT TCTGTTATTA ATTATTTCTT TTTTTATTAA TAACTTTGTT 
GATAAAAATG AAGAAGATCA GGAAGCAAGA CCCGGTGAAT CGCCTCTGGA TGAAGATATT 
ATCTCAAATC GGGAAATACT GGGCTTTTAT GTCAACTGGC TAACCCCATA TGCTAATTCA 
TATGATGCCA TGGTTTCTAA CCACAGGTAT GTTGACATGG TAGCACCCTT CTGGTTTACA 
GCCAACCCTG ATGGTACAAT CAAGAGTAGA TACGGGGGGC ACCAGTATGA GGTAGATTCC 
TTTTCCAAAA GACAGGGTCT TGAATTACTA CCTCTGATTA ATAACAACCA GAAAAATAAC 
ATGATCCTGG TTGATTCAGA TGTCAGGAGT AAGACGATAA AAAATATAGT TAAGCTGGTG 
GAAAAATATA ATTATAATGG AGTAAATATT GACTTTGAAT TTATTCCACC CTGGACCCGT 
AATGGTTATA CCCAGTTTAT TAAAGAGCTT TCCAGTGAGT TAAACAAGAA AAACAAAAAA 
CTTACAATCT CCGTTTTTCC TAAAATAGAT GTCCCGATGG AGTTACAGGG AGCCTATGAT 
TATGCAGCCC TGGGAAAACT GGTTGACAGG GTAGTTATCA TGACCTATGA CCACCACTGG 
CCCTCCGGTG ACCCCGGACC GATTGCCCCC ATAAACTGGG TCGAAAAGAA TATTAAATAT 
GCACTGGAAT ATATACCAAA TGAGAAACTT CTAATAGGAG TAGCTAACTA CGGCTATGAC 
TGGCCTGAGG GGGGACCCGG TAGGCCCATC AGTGCTAAAG AAGCAATGAA CCTGGCCCGG 
GAAAAGGGCG TTAAAGTTCA ATGGGATACA CCTTCCCAGA GCCCCTATTT CTATTACCAG 
GATAACAGTG GCATTAAACA CGAAGTCTGG TTTGAATCAA GTAGTAGCCT TGCCTTCAAA 
CTGGAGCTGG TTAAGAAATA TAATCTGAAA GGTATAGCCA TCTGGCGGCT GGGAAATGGT 
ACTGACCGGT TCTGGGAGAT TATAGACAAT AAATTAGGTC AGTGA

Protein sequence

MLVSPVIYCA ATSSEEGPGT FDWLKGILLL IISFFINNFV DKNEEDQEAR PGESPLDEDI 
ISNREILGFY VNWLTPYANS YDAMVSNHRY VDMVAPFWFT ANPDGTIKSR YGGHQYEVDS 
FSKRQGLELL PLINNNQKNN MILVDSDVRS KTIKNIVKLV EKYNYNGVNI DFEFIPPWTR 
NGYTQFIKEL SSELNKKNKK LTISVFPKID VPMELQGAYD YAALGKLVDR VVIMTYDHHW 
PSGDPGPIAP INWVEKNIKY ALEYIPNEKL LIGVANYGYD WPEGGPGRPI SAKEAMNLAR 
EKGVKVQWDT PSQSPYFYYQ DNSGIKHEVW FESSSSLAFK LELVKKYNLK GIAIWRLGNG 
TDRFWEIIDN KLGQ