Gene Mmcs_3749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_3749
Symbol
ID	4112580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	4001593
End bp	4002819
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	68%
IMG OID	638032888
Product	amidohydrolase
Protein accession	YP_640911
Protein GI	108800714
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.468026
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGACAC TGAAGGCGGC CGGGTACGTC GACGTCGATG CCGGGGAGAT CATCCGCCCC 
GGCATCGTCC GTGTCGACGG TGACCGGATC GTCTCCGTCG GCGGATCGCC GGTCGACGGT 
GACGAGGTGA TCGATCTCGG CGACTCGATC CTGTTGCCCG GCCTGATGGA CATGGAGGTC 
AACCTCCTGA TGGGCGGCCG GGGCGAGAAC CCCGGCCTGT CCCAGGTGCA GGACGACCCC 
CCGACCCGGG TGTTGCGCGC GGTGGGCAAC GCCAGGCGCA CCCTGCGCGC CGGGTTCACC 
ACAGTGCGCA ACCTCGGTCT GTTCGTCAAG ACCGGCGGAT ACCTGCTCGA CGTCGCGCTC 
GGTAAGGCGA TCGACGCCGG CTGGATCGAC GGGCCGCGTG TCATCCCGGC GGGACACGCG 
ATCACGCCGA CCGGCGGCCA TCTCGACCCC ACGATGTTCG CGGCGTTCAT GCCGGGCGCA 
CTGGAGTTGA CGGTCGAGGA GGGCATCGCC AACGGCATCG ACGAGATCCG CAAGGCCGTG 
CGCTACCAGA TCAAACACGG CGCCCAGCTG ATCAAGGTGT GCGTATCCGG CGGCGTCATG 
TCGTTGACGG GTGAGGCTGG CGCACAACAC TATTCGGACG AGGAACTGCG CGCCATCGTC 
GACGAGGCGC ACCGGCGCGG GCTGCGGGTG GCTGCCCACA CCCACGGCGC CGAGGCGGTC 
AAACACGCAG TGGCCTGCGG TATCGACTGC ATCGAGCACG GATTCCTGAT GGACGACGAG 
GCCATCCAGA TGCTGGTCGA CAACGACCGA TTCCTGGTGA CGACGCGGCG GCTGGCGGAG 
TACATGGACG TGTCCAAGGC GCCGCCGGAG TTGCAGGCCA AGGCCGCTGA GATGTTCCCC 
AAGGCGCGCA CGTCGATCAA GGCCGCCTAC GAGGCGGGCG TGAAGATCGC CGTCGGCACC 
GACGCCCCGG CGATCCCGCA CGGCCGCAAC GCCGACGAAC TCGTCACCCT CGTCGAATGG 
GGTATGCCGC CGGCCGCGGT GCTGCGGGCC GCGACCGTCG TGGCCGCCGA TCTGATCAAC 
GTCAGCGACC GCGGCCGCCT GGCCGAGGGA CTGCTCGCCG ACATCATCGC CGTACCGGGA 
GATCCGTTGT CCGACATCAC CGTCACCCGG CACGTGAACT TCGTCATGAA AGGCGGAAAG 
GTCTTCAAGA ATGACAGCGC CAATTAG

Protein sequence

MLTLKAAGYV DVDAGEIIRP GIVRVDGDRI VSVGGSPVDG DEVIDLGDSI LLPGLMDMEV 
NLLMGGRGEN PGLSQVQDDP PTRVLRAVGN ARRTLRAGFT TVRNLGLFVK TGGYLLDVAL 
GKAIDAGWID GPRVIPAGHA ITPTGGHLDP TMFAAFMPGA LELTVEEGIA NGIDEIRKAV 
RYQIKHGAQL IKVCVSGGVM SLTGEAGAQH YSDEELRAIV DEAHRRGLRV AAHTHGAEAV 
KHAVACGIDC IEHGFLMDDE AIQMLVDNDR FLVTTRRLAE YMDVSKAPPE LQAKAAEMFP 
KARTSIKAAY EAGVKIAVGT DAPAIPHGRN ADELVTLVEW GMPPAAVLRA ATVVAADLIN 
VSDRGRLAEG LLADIIAVPG DPLSDITVTR HVNFVMKGGK VFKNDSAN