Gene Hmuk_2922 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2922
Symbol
ID	8412474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	2808060
End bp	2810033
Gene Length	1974 bp
Protein Length	657 aa
Translation table	11
GC content	65%
IMG OID	645021268
Product	glycoside hydrolase family 18
Protein accession	YP_003178734
Protein GI	257388961
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3325] Chitinase
TIGRFAM ID	[TIGR01634] phage tail protein, P2 protein I family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.183514
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACGTC GCAACTATCT ACAATCGCTT TCGGCGCTGG CCGGTCTGGC CGGCGTCTCC 
GCGGTAACAG CACAGGAAGA GTATCCGGCG TACGATTCGA GCGCGACCTA CAACGGTGGC 
GATCGAGTCG TCTACGAGGG ATACATCTGG GAAGCACAGT GGTGGACCAA AGGAACGGCA 
CCGAGCGCAG ACAAGGCTGT CTGGGAGAAA GTCGGACCCG CTGACGGAGG CGGCGGGGAC 
GACGGCGGCT CCGACGACGG CGGCAGCAGC GACATTCCTG CCTACGATTC GAGCGCCACC 
TACACCGGTG GCGACCAGGT CACCTACGAC GGGTTCGTCT GGGAGGCCGA GTGGTGGACC 
AAGGGTACCG AACCCTCCGA GAGCGCGAAC GTCTGGACGA AGGTCCGCGC CGTCGACGAC 
GGCGACAACG GCGGCGACGA CGGTGGATCC TCCGACCTCA ACGCCGTCAT CGACGCCAGC 
GCGACGCGCG TCGACGTCGG TGAGGACGTC ACGCTGGACG CCAGCGGCTC CGAGGGCGAC 
ATCGAGTCCT ACGAGTGGAT GGTCGGCGAC CAGGGTCCGA TCTCCGGCGT CGAGAACACG 
GTCACGCTCG ACGAGGAAGG CACCTACGAG GTCACGCTGA CCGTCACCGA CGCAGACGGC 
AACGAGGCGA CCGCGACCCG ATCCGTGTTC GTCGGCACCG CGGGCGGCAC GCAGCCCGGC 
GACAAGCGAG TCGTCGCCTA CTACCGACAG TGGGCACAGT ACGACCGCGA GTACACCCCG 
TCCGACATGC CCCTGGACAA CATCACGCAC GTCCAGTACG CGTTCGCGCG CCCGGAGGAG 
GACGGCTCCG TCAACCTCGT CGGCGACAGT CACGGCCAGC AGGCGTTCTG GGACCAGAAC 
ACCGACTGGC GTGACGCACC CGGCGGAAAG AGCATCGCCG AGCTCGCAGA AGAGAACGAA 
GACACCAAGT TCACGCTCTC GATCGGTGGC TGGGGCGACT CCGAGTACTT CTCGTACGCC 
GCAGAAACCG AGGAGAACCG CCAGCGCTTC GCCGACCAGT GTGCCGAGTG GGTCGACCGA 
GGCAACCTCG ACGGCATCGA CATCGACTGG GAGTTCCCCC ACGGCGGGGG CTGTCAGGGC 
GACGGCGGCG AGGCGTGTAA CAAGGAGAAC GTCGAACGTC CCGAAATCGA CATTCCGAAC 
TTCACGAAGC TGTGTCAGGC GGTCCGCGAT CGCCTCGACG AGAAGGCGGC AGAGGAAGGT 
CGCGAAGAGC CCTACGAGGT CACCGCTGCG GTCAACGCGG ACCCCGAGGC GATGGCCGAC 
TACGAGCACG AGGCCCTGTC GGACATCCTC GACTTCATCC TCGTGATGAC CTTCGACTAC 
GCGGGTATCT GGAGCGAGTA CACCCGCCAT CACGCCCCGC TCAAGGAGAA CCCGGACAAC 
CCGTTCGAGA AGTCCGACAG CTGGAACGCC TCCTACGCTC TCAGCTGGTT CGAACAGCAG 
GGCTGGTCGC CGGACCAGCT CAACATGGCC GTCCCGTTCT ACGGGCGTAG CTGGAGCAAC 
GTCAACGACC CCGACGGCGA GGGCAACGGC GAGGACGACG GTCTCTTCCA GAAGTTCGAC 
GGAGAGGACG GCAACGCCAG CGGCGACGGT AGCTTCGGTA CTATCGGTGG TATCTACGAG 
TACTACGACC TCGCCGGTGG CTCCCGTGGC GGCTCCAGTA TCATCGACGG CGACGACTAC 
GAGACCTACA TCGACGAGGA CGCCATGACG GCCTACAGCT ACAACCCCGA CAAGGGCGGT 
GGCTACAACA AGGCCAGCGG CGAGATGATC TCCCACGACA CCGTCGAGAC CATGGAGATG 
AAAGCCCAGT GGCTCCGCGA CTCGCCGTAC GGCGGGACGA TGCTGTGGGC CATCGGTGGC 
GACACGAAGG ACGGCGAACT GATCAGCACG CTCTGGAACA CGCTCAACGA ATAG

Protein sequence

MQRRNYLQSL SALAGLAGVS AVTAQEEYPA YDSSATYNGG DRVVYEGYIW EAQWWTKGTA 
PSADKAVWEK VGPADGGGGD DGGSDDGGSS DIPAYDSSAT YTGGDQVTYD GFVWEAEWWT 
KGTEPSESAN VWTKVRAVDD GDNGGDDGGS SDLNAVIDAS ATRVDVGEDV TLDASGSEGD 
IESYEWMVGD QGPISGVENT VTLDEEGTYE VTLTVTDADG NEATATRSVF VGTAGGTQPG 
DKRVVAYYRQ WAQYDREYTP SDMPLDNITH VQYAFARPEE DGSVNLVGDS HGQQAFWDQN 
TDWRDAPGGK SIAELAEENE DTKFTLSIGG WGDSEYFSYA AETEENRQRF ADQCAEWVDR 
GNLDGIDIDW EFPHGGGCQG DGGEACNKEN VERPEIDIPN FTKLCQAVRD RLDEKAAEEG 
REEPYEVTAA VNADPEAMAD YEHEALSDIL DFILVMTFDY AGIWSEYTRH HAPLKENPDN 
PFEKSDSWNA SYALSWFEQQ GWSPDQLNMA VPFYGRSWSN VNDPDGEGNG EDDGLFQKFD 
GEDGNASGDG SFGTIGGIYE YYDLAGGSRG GSSIIDGDDY ETYIDEDAMT AYSYNPDKGG 
GYNKASGEMI SHDTVETMEM KAQWLRDSPY GGTMLWAIGG DTKDGELIST LWNTLNE