Gene Mmcs_1960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1960
Symbol
ID	4110794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	2110305
End bp	2111411
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	73%
IMG OID	638031082
Product	amidohydrolase
Protein accession	YP_639125
Protein GI	108798928
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGCAC TGCACGTGCG CGGCCGAGGT CTGCCCGACG GGCAGCCGGT CGAGTGGTGG 
GTGGTCGACG AGGGCTCGCC CGAAGACGGT AGGTCCCGCG GGGTGCTGCG GTCCGAACCG 
GTGCGCGGCG CCGAGACGGT CTGGGACGGC GGCTGGATCG TGCCCGGACT GGTCGACGCG 
CACTGCCATG TCGGGCTCGG ACCGGTGCCC GGGGGTGCGG TCGGCATCGA CGAGGCGGCC 
GCGCAGGCCG AGACCGAACG GGCCGTCGGC GCGTTGCTGC TGCGTGACTG CGGGTCGCCC 
ACCGACACCC GCAGCCTCGA CGACCGCGAC GACCTGCCGC GGATCATCCG CGCCGGCCGG 
CACGTGGCCA AGCCCAAGCG TTACCTCGCC GGCTACGCGG TCGACGTCGA GGACGAATCG 
CAACTCCCCG GCATCGTCGC CGAGCAGGCC CGCCGCGGGG ACGGCTGGGT GAAGCTGGTC 
GGCGACTGGA TCGACCGGTC GATCGGCGAC CTGGCGCCGC TGTGGGACGA CGAGATTCTC 
GAACAGGCCA TCGCGGCCGC CCATGCCAAC GGCGCCCGGG TGACCGCGCA CGTCTTCGGC 
GAGGACGCGC TGCCCGGTCT GATCAACGCC GGGATCGATT GCATCGAGCA CGGCACCGGC 
CTGACCGACG ACACGATCGA GTTGATGGTC GAGCGTGGGA CCGCGCTGGT GCCGACGCTG 
ATCAACCTCG AGAACTTTCC CGGGATCGCC GACCAGGCGG CCAAGTACCC GACCTACGCC 
GCCCACATGC GCGACCTCTA CCAGCGCAGC TATGCGCGCG TGGCGGCCGC GCGGGAGGCC 
GGTGTGCCGA TCTACGCCGG CACCGACGCC GGCAGCACGA TCGCCCACGG GCGCATCGGC 
GACGAGATCG ACGCCCTGCG GGGCATCGGG ATGAGCGCGA CGGATGCGTT GGGCGCGGCG 
TGCTGGGATG CGCGCACCTG GCTGGGCCGG CCGGGGCTGG TCGACGGCGC CCCCGCCGAT 
CTGGTGTGTT ACGACCAAGA TCCGCGCCTC GGCTCCGCGG TGGTCAACGA GCCGGCGCTG 
GTCATCCTGC GGGGCCGGGT CTTCTAG

Protein sequence

MPALHVRGRG LPDGQPVEWW VVDEGSPEDG RSRGVLRSEP VRGAETVWDG GWIVPGLVDA 
HCHVGLGPVP GGAVGIDEAA AQAETERAVG ALLLRDCGSP TDTRSLDDRD DLPRIIRAGR 
HVAKPKRYLA GYAVDVEDES QLPGIVAEQA RRGDGWVKLV GDWIDRSIGD LAPLWDDEIL 
EQAIAAAHAN GARVTAHVFG EDALPGLINA GIDCIEHGTG LTDDTIELMV ERGTALVPTL 
INLENFPGIA DQAAKYPTYA AHMRDLYQRS YARVAAAREA GVPIYAGTDA GSTIAHGRIG 
DEIDALRGIG MSATDALGAA CWDARTWLGR PGLVDGAPAD LVCYDQDPRL GSAVVNEPAL 
VILRGRVF