Gene Mmcs_5301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_5301
Symbol
ID	4114128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	5587380
End bp	5588369
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	71%
IMG OID	638034457
Product	cellulase
Protein accession	YP_642458
Protein GI	108802261
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG5297] Cellobiohydrolase A (1,4-beta-cellobiosidase A)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.104046
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCTCAG CTGTTGGTGC AGTCGCGCGG TGGGTCGCGC CGTTCCTGAC GGTCGCGGCC 
GTCGCGGGTA CGGCCGCCGT CGCCGAACCC GTGAACGTCG ACCCCGCTCC GGCGGTGCGT 
CTGGTCAGCG ATGCGAACCC GCTGGTCGGC AGGCCCTTCT ATGTCAATCC GGCGTCCAAG 
GCCATGCGGG CGGTGCAGGG CAACTCGGAC CCGTTGCTGG CTTCGGTCGC CAACACCCCG 
ACGGCGTACT GGATGGATCA CCTCTCCACC CCGTCGGTCG ACTCGAAGTA CATCGCCGAC 
GCACAGGCCG CGGGCACCAC ACCGATCCTG GCGCTGTACG GCATCCCCAA CCGCGACTGC 
GGGAGCTTCG CCGCGGGCGG ATTCGGCTCG GCCGGGGCGT ATCGAGCGTG GATCGACGGC 
GTGGCCGGAG CCATCGGAGG GGGCCCGGCG GCGGTCGTCC TCGAACCCGA CGCGCTGGCC 
ATGATCGACT GCCTGTCACC GGGCCAGCAG CAGGAACGCC TCGAGCTGAT CGGCTACGCC 
GTCGACACCC TGACCCGCAA CCCGGCCACC GCGGTGTACG TGGACGCCGG TCATCCGCGC 
TGGGTGGCCG CCGATGTGAT GGCCGGCCGG CTGAACCAGG TCGGCGTCGC CAAGGCGCGC 
GGCTTCAGCC TCAACACCGC CAACTTCTTC ACCACCGAGG AGTCGATCGG CTACGGCCAG 
GCCGTCTCGG GGATGACGAA CGGATCGCAC TTCGTGATCG ACACGTCGCG CAACGGCGTC 
GGACCGGTCG ACAGCGATTC GTGGTGCAAC CCTCCCGGCC GCGCGTTGGG CACCCCGCCC 
ACGACGGCCA CCGGCCACCC GCAGGTCGAC GCCTTCCTGT GGGTCAAGCG TCCCGGTGAG 
TCCGACGGAT CGTGCGGCGG CGGGGCGCCC AGCGCGGGCA CGTTCGTCGC TCAGTACGCC 
ATCGATCTGG CCCGCACCGC AGGCTGGTAG

Protein sequence

MSSAVGAVAR WVAPFLTVAA VAGTAAVAEP VNVDPAPAVR LVSDANPLVG RPFYVNPASK 
AMRAVQGNSD PLLASVANTP TAYWMDHLST PSVDSKYIAD AQAAGTTPIL ALYGIPNRDC 
GSFAAGGFGS AGAYRAWIDG VAGAIGGGPA AVVLEPDALA MIDCLSPGQQ QERLELIGYA 
VDTLTRNPAT AVYVDAGHPR WVAADVMAGR LNQVGVAKAR GFSLNTANFF TTEESIGYGQ 
AVSGMTNGSH FVIDTSRNGV GPVDSDSWCN PPGRALGTPP TTATGHPQVD AFLWVKRPGE 
SDGSCGGGAP SAGTFVAQYA IDLARTAGW