Gene Mkms_3822 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3822
Symbol
ID	4611757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	4036075
End bp	4037301
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	68%
IMG OID	639793502
Product	amidohydrolase
Protein accession	YP_939805
Protein GI	119869853
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.28333
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGACAC TGAAGGCGGC CGGGTACGTC GACGTCGATG CCGGGGAGAT CATCCGCCCC 
GGCATCGTCC GTGTCGACGG TGACCGGATC GTCTCCGTCG GCGGATCGCC GGTCGACGGT 
GACGAGGTGA TCGATCTCGG CGACTCGATC CTGTTGCCCG GCCTGATGGA CATGGAGGTC 
AACCTCCTGA TGGGCGGCCG GGGCGAGAAC CCCGGCCTGT CCCAGGTGCA GGACGACCCC 
CCGACCCGGG TGTTGCGCGC GGTGGGCAAC GCCAGGCGCA CCCTGCGCGC CGGGTTCACC 
ACAGTGCGCA ACCTCGGTCT GTTCGTCAAG ACCGGCGGAT ACCTGCTCGA CGTCGCGCTC 
GGTAAGGCGA TCGACGCCGG CTGGATCGAC GGGCCGCGTG TCATCCCGGC GGGACACGCG 
ATCACGCCGA CCGGCGGCCA TCTCGACCCC ACGATGTTCG CGGCGTTCAT GCCGGGCGCA 
CTGGAGTTGA CGGTCGAGGA GGGCATCGCC AACGGCATCG ACGAGATCCG CAAGGCCGTG 
CGCTACCAGA TCAAACACGG CGCCCAGCTG ATCAAGGTGT GCGTATCCGG CGGCGTCATG 
TCGTTGACGG GTGAGGCTGG CGCACAACAC TATTCGGACG AGGAACTGCG CGCCATCGTC 
GACGAGGCGC ACCGGCGCGG GCTGCGGGTG GCTGCCCACA CCCACGGCGC CGAGGCGGTC 
AAACACGCAG TGGCCTGCGG TATCGACTGC ATCGAGCACG GATTCCTGAT GGACGACGAG 
GCCATCCAGA TGCTGGTCGA CAACGACCGA TTCCTGGTGA CGACGCGGCG GCTGGCGGAG 
TACATGGACG TGTCCAAGGC GCCGCCGGAG TTGCAGGCCA AGGCCGCTGA GATGTTCCCC 
AAGGCGCGCA CGTCGATCAA GGCCGCCTAC GAGGCGGGCG TGAAGATCGC CGTCGGCACC 
GACGCCCCGG CGATCCCGCA CGGCCGCAAC GCCGACGAAC TCGTCACCCT CGTCGAATGG 
GGTATGCCGC CGGCCGCGGT GCTGCGGGCC GCGACCGTCG TGGCCGCCGA TCTGATCAAC 
GTCAGCGACC GCGGCCGCCT GGCCGAGGGA CTGCTCGCCG ACATCATCGC CGTACCGGGA 
GATCCGTTGT CCGACATCAC CGTCACCCGG CACGTGAACT TCGTCATGAA AGGCGGAAAG 
GTCTTCAAGA ATGACAGCGC CAATTAG

Protein sequence

MLTLKAAGYV DVDAGEIIRP GIVRVDGDRI VSVGGSPVDG DEVIDLGDSI LLPGLMDMEV 
NLLMGGRGEN PGLSQVQDDP PTRVLRAVGN ARRTLRAGFT TVRNLGLFVK TGGYLLDVAL 
GKAIDAGWID GPRVIPAGHA ITPTGGHLDP TMFAAFMPGA LELTVEEGIA NGIDEIRKAV 
RYQIKHGAQL IKVCVSGGVM SLTGEAGAQH YSDEELRAIV DEAHRRGLRV AAHTHGAEAV 
KHAVACGIDC IEHGFLMDDE AIQMLVDNDR FLVTTRRLAE YMDVSKAPPE LQAKAAEMFP 
KARTSIKAAY EAGVKIAVGT DAPAIPHGRN ADELVTLVEW GMPPAAVLRA ATVVAADLIN 
VSDRGRLAEG LLADIIAVPG DPLSDITVTR HVNFVMKGGK VFKNDSAN