Gene Mmcs_0229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_0229
Symbol
ID	4109075
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	254102
End bp	255307
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	74%
IMG OID	638029354
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_637406
Protein GI	108797209
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0813841
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCAGAGC CCATGGCTTG GACCCGAGGA CTGTGTGCAC TGGTCGCGAC GTCGGGAATG 
CTGCTCGCGT GCTCGTCGCC GAAGCAGGAA CCCGCGGCCG CACCGGCCGA TCCGGCGATC 
ACCGCCGCCC CAGTCTCCGC CGCCCCCGCC GTTCCGCTGA AGGCCCCGGT GCCGCTGGCG 
CCCGGCGCTG CGGCATGCGG TCAGGGCGCC GCGTTGCTCT CGGAGATGAC GACCCGCGAC 
AAGCTGGCCC AGCTGCTGAT GGTCGGCGTC AGCGGCGCCG CGGACGCCCG CGCGGTGGTC 
GACAACCACC GCATCGGCGG CATCATGATC GGCAGTTGGA CCGACCTGTC GATGATGGGC 
GCCCCGCTGG CCGAGATCGC CGCCTCCGCG GGCCCGCTGC CGCTGGCGGT CAGCGTCGAC 
GAGGAGGGCG GCCGGGTCTC CCGGCTGGCT TCACTGATCG GCAGCCAACC GTCGGCGCGG 
GCGCTGGCCC AGAGTTCGAC CCCCGACCAG GTCTACGGCA TCGCGCTCGA ACGGGGCCGG 
GCGATGCGCG GTCTCGGCGT CACGATCGAC TTCGCGCCGG TCGTCGACGT CACCGGGGCC 
AGTGCCGCCA TCGGTGACCG GTCCTTCGGC GACGACCCGG CGACGGTCAC CGAATACGCC 
GGGGCGTACG CCCGCGGGCT GCGCGACGCC GGGGTGCTGC CGGTGCTCAA ACACTTCCCG 
GGCCACGGCA ACGCCTCCGG CGACTCGCAC ACCGAGGGCG TTGTCACCCC GCCGCTGTCC 
GAGCTGCAGA ACTCCGACCT CGTGCCGTAC CGCACGCTGA CCGCGCAGGC GCCGGTCGGG 
GTGATGGTCG GCCACATGCA GGTGCCGGGA CTGACCGGAA GCGATCCGGC GAGCCTGAGC 
CCGGCGGCCT ACCAGCTGCT GCGGTCGGGC GGCTACGGCG GGCCGGGGTT CAACGGTCCG 
GTCTTCACCG ACGACATCTC GAGCATGCGG GCGATCACCG ATCGGTACGG GGTGGCCGAT 
GCGGCGCTGC GCGCCCTGCA GGCCGGCGCC GACACCGCGT TGTGGGTGAC GACGGCCGAG 
GTGCCCGCGG TGCTCGACCG GCTCGAACAG GCGGTGGGCT CCGGTGAGCT GACGATGCCG 
CGCGTCGACC AGTCGGTGCT GCGGGTGGCG GCGATGAAGG GCCCGAACCC GCGCTGCGGC 
GGCTGA

Protein sequence

MSEPMAWTRG LCALVATSGM LLACSSPKQE PAAAPADPAI TAAPVSAAPA VPLKAPVPLA 
PGAAACGQGA ALLSEMTTRD KLAQLLMVGV SGAADARAVV DNHRIGGIMI GSWTDLSMMG 
APLAEIAASA GPLPLAVSVD EEGGRVSRLA SLIGSQPSAR ALAQSSTPDQ VYGIALERGR 
AMRGLGVTID FAPVVDVTGA SAAIGDRSFG DDPATVTEYA GAYARGLRDA GVLPVLKHFP 
GHGNASGDSH TEGVVTPPLS ELQNSDLVPY RTLTAQAPVG VMVGHMQVPG LTGSDPASLS 
PAAYQLLRSG GYGGPGFNGP VFTDDISSMR AITDRYGVAD AALRALQAGA DTALWVTTAE 
VPAVLDRLEQ AVGSGELTMP RVDQSVLRVA AMKGPNPRCG G