Gene Mkms_0239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_0239
Symbol
ID	4615468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	261442
End bp	262647
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	74%
IMG OID	639789914
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_936246
Protein GI	119866294
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.716439
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCAGAGC CCATGGCTTG GACCCGAGGA CTGTGTGCAC TGGTCGCGAC GTCGGGAATG 
CTGCTCGCGT GCTCGTCGCC GAAGCAGGAA CCCGCGGCCG CACCGGCCGA TCCGGCGATC 
ACCGCCGCCC CAGTCTCCGC CGCCCCCGCC GTTCCGCTGA AGGCCCCGGT GCCGCTGGCG 
CCCGGCGCTG CGGCATGCGG TCAGGGCGCC GCGTTGCTCT CGGAGATGAC GACCCGCGAC 
AAGCTGGCCC AGCTGCTGAT GGTCGGCGTC AGCGGCGCCG CGGACGCCCG CGCGGTGGTC 
GACAACCACC GCATCGGCGG CATCATGATC GGCAGTTGGA CCGACCTGTC GATGATGGGC 
GCCCCGCTGG CCGAGATCGC CGCCTCCGCG GGCCCGCTGC CGCTGGCGGT CAGCGTCGAC 
GAGGAGGGCG GCCGGGTCTC CCGGCTGGCT TCACTGATCG GCAGCCAACC GTCGGCGCGG 
GCGCTGGCCC AGAGTTCGAC CCCCGACCAG GTCTACGGCA TCGCGCTCGA ACGGGGCCGG 
GCGATGCGCG GTCTCGGCGT CACGATCGAC TTCGCGCCGG TCGTCGACGT CACCGGGGCC 
AGTGCCGCCA TCGGTGACCG GTCCTTCGGC GACGACCCGG CGACGGTCAC CGAATACGCC 
GGGGCGTACG CCCGCGGGCT GCGCGACGCC GGGGTGCTGC CGGTGCTCAA ACACTTCCCG 
GGCCACGGCA ACGCCTCCGG CGACTCGCAC ACCGAGGGCG TTGTCACCCC GCCGCTGTCC 
GAGCTGCAGA ACTCCGACCT CGTGCCGTAC CGCACGCTGA CCGCGCAGGC GCCGGTCGGG 
GTGATGGTCG GCCACATGCA GGTGCCGGGA CTGACCGGAA GCGATCCGGC GAGCCTGAGC 
CCGGCGGCCT ACCAGCTGCT GCGGTCGGGC GGCTACGGCG GGCCGGGGTT CAACGGTCCG 
GTCTTCACCG ACGACATCTC GAGCATGCGG GCGATCACCG ATCGGTACGG GGTGGCCGAT 
GCGGCGCTGC GCGCCCTGCA GGCCGGCGCC GACACCGCGT TGTGGGTGAC GACGGCCGAG 
GTGCCCGCGG TGCTCGACCG GCTCGAACAG GCGGTGGGCT CCGGTGAGCT GACGATGCCG 
CGCGTCGACC AGTCGGTGCT GCGGGTGGCG GCGATGAAGG GCCCGAACCC GCGCTGCGGC 
GGCTGA

Protein sequence

MSEPMAWTRG LCALVATSGM LLACSSPKQE PAAAPADPAI TAAPVSAAPA VPLKAPVPLA 
PGAAACGQGA ALLSEMTTRD KLAQLLMVGV SGAADARAVV DNHRIGGIMI GSWTDLSMMG 
APLAEIAASA GPLPLAVSVD EEGGRVSRLA SLIGSQPSAR ALAQSSTPDQ VYGIALERGR 
AMRGLGVTID FAPVVDVTGA SAAIGDRSFG DDPATVTEYA GAYARGLRDA GVLPVLKHFP 
GHGNASGDSH TEGVVTPPLS ELQNSDLVPY RTLTAQAPVG VMVGHMQVPG LTGSDPASLS 
PAAYQLLRSG GYGGPGFNGP VFTDDISSMR AITDRYGVAD AALRALQAGA DTALWVTTAE 
VPAVLDRLEQ AVGSGELTMP RVDQSVLRVA AMKGPNPRCG G