Gene Mkms_2006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_2006
Symbol
ID	4613572
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	2129289
End bp	2130395
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	73%
IMG OID	639791672
Product	amidohydrolase
Protein accession	YP_937995
Protein GI	119868043
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0811412
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.722686
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCAC TGCACGTGCG CGGCCGAGGT CTGCCCGACG GGCAGCCGGT CGAGTGGTGG 
GTGGTCGACG AGGGCTCGCC CGAAGACGGT AGGTCCCGCG GGGTGCTGCG GTCCGAACCG 
GTGCGCGGCG CCGAGACGGT CTGGGACGGC GGCTGGATCG TGCCCGGACT GGTCGACGCG 
CACTGCCATG TCGGGCTCGG ACCGGTGCCC GGGGGTGCGG TCGGCATCGA CGAGGCGGCC 
GCGCAGGCCG AGACCGAACG GGCCGTCGGC GCGTTGCTGC TGCGTGACTG CGGGTCGCCC 
ACCGACACCC GCAGCCTCGA CGACCGCGAC GACCTGCCGC GGATCATCCG CGCCGGCCGG 
CACGTGGCCA AGCCCAAGCG TTACCTCGCC GGCTACGCGG TCGACGTCGA GGACGAATCG 
CAACTCCCCG GCATCGTCGC CGAGCAGGCC CGCCGCGGGG ACGGCTGGGT GAAGCTGGTC 
GGCGACTGGA TCGACCGGTC GATCGGCGAC CTGGCGCCGC TGTGGGACGA CGAGATTCTC 
GAACAGGCCA TCGCGGCCGC CCATGCCAAC GGCGCCCGGG TGACCGCGCA CGTCTTCGGC 
GAGGACGCGC TGCCCGGTCT GATCAACGCC GGGATCGATT GCATCGAGCA CGGCACCGGC 
CTGACCGACG ACACGATCGA GTTGATGGTC GAGCGTGGGA CCGCGCTGGT GCCGACGCTG 
ATCAACCTCG AGAACTTTCC CGGGATCGCC GACCAGGCGG CCAAGTACCC GACCTACGCC 
GCCCACATGC GCGACCTCTA CCAGCGCAGC TATGCGCGCG TGGCGGCCGC GCGGGAGGCC 
GGTGTGCCGA TCTACGCCGG CACCGACGCC GGCAGCACGA TCGCCCACGG GCGCATCGGC 
GACGAGATCG ACGCCCTGCG GGGCATCGGG ATGAGCGCGA CGGATGCGTT GGGCGCGGCG 
TGCTGGGATG CGCGCACCTG GCTGGGCCGG CCGGGGCTGG TCGACGGCGC CCCCGCCGAT 
CTGGTGTGTT ACGACCAAGA TCCGCGCCTC GGCTCCGCGG TGGTCAACGA GCCGGCGCTG 
GTCATCCTGC GGGGCCGGGT CTTCTAG

Protein sequence

MPALHVRGRG LPDGQPVEWW VVDEGSPEDG RSRGVLRSEP VRGAETVWDG GWIVPGLVDA 
HCHVGLGPVP GGAVGIDEAA AQAETERAVG ALLLRDCGSP TDTRSLDDRD DLPRIIRAGR 
HVAKPKRYLA GYAVDVEDES QLPGIVAEQA RRGDGWVKLV GDWIDRSIGD LAPLWDDEIL 
EQAIAAAHAN GARVTAHVFG EDALPGLINA GIDCIEHGTG LTDDTIELMV ERGTALVPTL 
INLENFPGIA DQAAKYPTYA AHMRDLYQRS YARVAAAREA GVPIYAGTDA GSTIAHGRIG 
DEIDALRGIG MSATDALGAA CWDARTWLGR PGLVDGAPAD LVCYDQDPRL GSAVVNEPAL 
VILRGRVF