Gene Mmcs_1701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1701
Symbol
ID	4110535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	1839053
End bp	1840234
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	68%
IMG OID	638030820
Product	4-carboxymuconolactone decarboxylase
Protein accession	YP_638866
Protein GI	108798669
COG category	[R] General function prediction only [S] Function unknown
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily) [COG0599] Uncharacterized homolog of gamma-carboxymuconolactone decarboxylase subunit
TIGRFAM ID	[TIGR00778] alkylhydroperoxidase AhpD family core domain [TIGR02425] 4-carboxymuconolactone decarboxylase [TIGR02427] 3-oxoadipate enol-lactonase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0186237
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAATC CGCCTCTCAC CGCCATCCAC CTCGGCGGAC CCGACGACGG GCCGCTGCTT 
TTGCTGGGCC CCTCGCTGGG GACAACGACG GCCACCCTGT GGACAGGCGT GGCGCAACGA 
CTGGTCGATC ATGTGCGCGT AGTCGGATGG GACCTTCCCG GTCACGGCCG CGGCCGTCGG 
GCCCACCCGT TCACCATCGC CGACCTCGCG GCAGCGGTGC TGGTGATCGC GGACGACCTT 
AACGTGGAGA CATTCCACTA CGCCGGTGAT TCGGTGGGTG GTTGCGTCGG TCTGCAGCTG 
CTGCTCGATG CTCCGCAACG GGTCAGCTCG GCGACCCTGC TGTGCACCGG CGCCGCCATC 
GGCACCCCGG ACGGCTGGCT CGCACGTGCC GCTACCGTCC GCGCCGGCGG TGTCGACACG 
ATGCTGACCG GCGCAGCCGA GCGCTGGTTC GCGCCGGGCT TTGTCGACCG CGAGCCGGGG 
ACCGCCTCGG CGCTGCTGGA TGCCCTGAGT CACACCGATG CGGAGTCCTA TGCGCAGGTA 
TGCGAAGCGT TAGCAGTGTT TGATGTAACC GATAGGTTGT CCGAGATCGT CACTCCGGTC 
CTGGCCGTTG CGGGTAGCGC TGACAGCCCC ACGCCGCCGG AATCGTTGCG GCGCATCGCC 
TCCGACGTAA AGGACGGGGA CCTGGTGGTG CTCGAAGGCG TCGGACACCT GGCCCCCGCC 
GAAGCGCCGG AGCGCGTGGC CGGCCTCATC GCAGAGATCG TCGGTGTTCC GCAGCCCCCG 
AGCAAGTCCC TCGAAGACGT GCACCGTGCA GGAATGGCGG TACGGCGGGA GGTGCTGGGC 
CATGCGCACG TCGACCGGGC AGTGGCCGGT ACCACCGACC TGACCGCCGA CTTCCAGCAC 
ATGATTACGC AGTATGCCTG GGGCAGCATC TGGACCCGCC CGGGTCTCGA CTTCCGCAGC 
CGCTCGATGA TCACGCTGAC GGCGCTGGTC GCGCGCGGTC ACCACGAGGA ACTGGCGATG 
CACCTGCGGG CGGCCCGCCG GAACGGTCTG AGCAACGACG AGATCAAAGA GCTGCTCTTG 
CAGACCGCGA TCTACTGCGG AGTTCCCGAC GCCAACTCCG CCTTCCGCAT CGCCGCCGAG 
GTCTTGCCGG AGTTTGACGA GCACCCAGGT GCGCCGTCAT GA

Protein sequence

MSNPPLTAIH LGGPDDGPLL LLGPSLGTTT ATLWTGVAQR LVDHVRVVGW DLPGHGRGRR 
AHPFTIADLA AAVLVIADDL NVETFHYAGD SVGGCVGLQL LLDAPQRVSS ATLLCTGAAI 
GTPDGWLARA ATVRAGGVDT MLTGAAERWF APGFVDREPG TASALLDALS HTDAESYAQV 
CEALAVFDVT DRLSEIVTPV LAVAGSADSP TPPESLRRIA SDVKDGDLVV LEGVGHLAPA 
EAPERVAGLI AEIVGVPQPP SKSLEDVHRA GMAVRREVLG HAHVDRAVAG TTDLTADFQH 
MITQYAWGSI WTRPGLDFRS RSMITLTALV ARGHHEELAM HLRAARRNGL SNDEIKELLL 
QTAIYCGVPD ANSAFRIAAE VLPEFDEHPG APS