Gene Mmcs_1868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1868
Symbol
ID	4110702
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	2012711
End bp	2014276
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	73%
IMG OID	638030988
Product	glycoside hydrolase family protein
Protein accession	YP_639033
Protein GI	108798836
COG category	[S] Function unknown
COG ID	[COG1543] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.261757
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGACG ACGCTCGGGT ACCGGGGCTG TTCACCCTCG TCCTGCACAC GCATCTGCCG 
TGGCTGGCGC ACCACGGCCG CTGGCCGGTC GGCGAGGAGT GGCTCTACCA GTCGTGGTCG 
GCGTCGTACC TGCCGCTGAT GCGCGTGCTG CGCAGGCTGG CCGGGGAGGG CCGCGACCAT 
CTGCTCACCC TCGGGATGAC ACCGGTGGTG ACCGCTCAGC TCGACGACCC CTACTGCCTG 
ACCGGGATGC ACAGCTGGCT GGCGAACTGG CAGCTGCGGG CACTGGAGGC CGCCACCCTG 
CGCGCCTCCT CGGACACCAC ACCGGCGTGC ACACCGGAAG CGTTGCGCGC CTTCGGTGTT 
CGCGAGCAGG GCGAAGCGGA GCTGGCGCTC GAGGAGTTCG CCACACTGTG GCGCCACGGC 
GGCAGTCCGC TGCTGCGTGA GCTCGTCGAC GCGGGCACCG TCGAACTGCT GGGCGGGCCG 
CTGGCGCATC CGTTCCAGCC GTTGCTCAAC CCCCGACTGC GGGAGTTCGC GCTGCGCGAA 
GGGCTCGCCG ACGCCGGACA GCGCTTCGCG CACACCCCGC GCGGCATCTG GGCCCCGGAG 
TGCGCGTACG CCCCGGGCAT GGAGGCCGAC TATGCCGCGG CGGGCGTCGG CCACTTCATG 
GTCGACGGCC CGTCGCTGCA CGGCGACACC GCGCTAGGCC GCCCCGTCGG CCACTCCGGC 
GTCGTCGCGT TCGGTCGCGA CCTGCAGGTC AGCTACCGCG TGTGGTCGCC CAAGTCCGGC 
TATCCCGGCC ACGCCGCCTA CCGCGACTTC CACACCTACG ACCACGTCAC CGGGTTGAAG 
CCGGCGCGGG TCACCGGGCG CAACGTGCCG TCGTCGGCCA AAGCCCCATA CGAACCGGAC 
CGCGCCGACG CCGCCATCGA CGCCCACGTC GCCGACTTCG TGCAGGTGGT GCGGCGGCGG 
CTGACGGACG AGAGCGAGCG GATCGGCCGC CCGGCGCACG TGGTCGCCGC CTTCGACACC 
GAACTGTTCG GCCACTGGTG GTACGAGGGG CCGGAGTGGC TGGCCCGCGT ACTGCGGGCG 
CTGCCGGAAG CCGGTGTGCG GGTGGGCACG CTCAGCGATG CCGTCGACGG CGGATTCGTC 
GGCGCCCCAG TCGATCTGCC GCCCAGTTCG TGGGGTTCGG GTAAGGACTG GCAGGTCTGG 
GCCGGAGACC AGGTGACCGA CTTCGTCCGA CTCAACGCCG AGGTCGTCGA CACCGCGCTC 
AGCACCGTCG ACAAGGCGCT CACCCAGCGC GCGTCGGTGG GCAGCCCGAC ACCGCGGGAC 
ACCGTCGCCG ACCAGATCCT GCGCGAGACC CTGCTGACCG TCTCGAGCGA CTGGCCGTTC 
ATGGTGAGCA AGGACTCCGC GGCCGACTAC GCCCGCTACC GCGCCCACCT GCACGCCCAC 
GCGACCCGCG AGATCGCCGA CGCACTCGCG GCCGGCCGGC GGGAGCAGGC CCAGCGCCTC 
GCCGACGGCT GGAACCGCGC CGACGGCCTG TTCGGCGCCC TCGACGCCCG CCGGTTGCCG 
CGATGA

Protein sequence

MSDDARVPGL FTLVLHTHLP WLAHHGRWPV GEEWLYQSWS ASYLPLMRVL RRLAGEGRDH 
LLTLGMTPVV TAQLDDPYCL TGMHSWLANW QLRALEAATL RASSDTTPAC TPEALRAFGV 
REQGEAELAL EEFATLWRHG GSPLLRELVD AGTVELLGGP LAHPFQPLLN PRLREFALRE 
GLADAGQRFA HTPRGIWAPE CAYAPGMEAD YAAAGVGHFM VDGPSLHGDT ALGRPVGHSG 
VVAFGRDLQV SYRVWSPKSG YPGHAAYRDF HTYDHVTGLK PARVTGRNVP SSAKAPYEPD 
RADAAIDAHV ADFVQVVRRR LTDESERIGR PAHVVAAFDT ELFGHWWYEG PEWLARVLRA 
LPEAGVRVGT LSDAVDGGFV GAPVDLPPSS WGSGKDWQVW AGDQVTDFVR LNAEVVDTAL 
STVDKALTQR ASVGSPTPRD TVADQILRET LLTVSSDWPF MVSKDSAADY ARYRAHLHAH 
ATREIADALA AGRREQAQRL ADGWNRADGL FGALDARRLP R