Gene Mjls_1940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_1940
Symbol
ID	4877662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	+
Start bp	2050211
End bp	2051317
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	73%
IMG OID	640139239
Product	amidohydrolase
Protein accession	YP_001070219
Protein GI	126434528
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.864175
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCAC TGCACGTGCG CGGCCGCGGT CTGCCCGACG GGCAGCCGGT CGAGTGGTGG 
GTGGTCGATG AGGGCTCGGC CGAAGACGGT AGGTCCCGCG GGGTGCTGCG GTCCGAACCG 
GTGCGCGGCG CCGAGACGGT CTGGGACGGT GGTTGGATCG TGCCCGGCCT GGTCGACGCG 
CACTGCCATG TCGGGCTCGG ACCGGTGCCC GGGGGTGCGG TCGGCATCGA CGAGGCGGCC 
GCGCAGGCCG AGACCGAACG GGCCGTCGGC GCGTTGCTGC TGCGTGACTG CGGGTCGCCC 
ACCGACACCC GCAGCCTCGA CGACCGCGAC GACCTGCCGC GGATCATCCG CGCCGGCCGG 
CACGTGGCCA AGCCCAAGCG TTACCTCGCC GGCTACGCGG TCGACGTCGA GGACGAATCG 
CAGCTCCCCG GCATCGTCGC CGAGCAGGCC CGCCGCGGTG ACGGCTGGGT GAAGCTGGTC 
GGCGACTGGA TCGACCGGTC GATCGGCGAC CTGGCGCCGC TGTGGGACGA CGAGATTCTC 
GAACAGGCCA TCGCGGCCGC CCATGCCAAC GGCGCCCGGG TGACCGCGCA CGTCTTCGGC 
GAGGACGCGC TGCCCGGTCT GATCAACGCC GGGATCGATT GCATCGAGCA CGGCACCGGC 
CTGACCGACG ACACGATCGA GTTGATGGTC GAGCGTGGGA CCGCGCTGGT GCCGACGCTG 
ATCAACCTCG AGAACTTTCC CGGGATCGCC GACCAGGCGG CCAAGTACCC GACCTACGCC 
GCCCACATGC GCGACCTCTA CCAGCGCAGC TATGCGCGCG TGGCGGCCGC GCGGGAGGCC 
GGTGTGCCGA TCTACGCCGG CACCGACGCC GGCAGCACGA TCGCCCACGG GCGCATCGGC 
GACGAGATCG ACGCGCTGCG GGGCATCGGG ATGAGCGCGA CGGATGCGTT GGGCGCGGCG 
TGCTGGGATG CGCGCACCTG GCTGGGCCGG CCGGGGCTGG TCGACGGCGC CCCCGCCGAT 
CTGGTGTGTT ACGACGAGGA TCCGCGCCTC GGCTCCGCGG TGGTCAACGA GCCGGGGCTG 
GTCATCCTGC GGGGCCGGGT CTTCTAG

Protein sequence

MPALHVRGRG LPDGQPVEWW VVDEGSAEDG RSRGVLRSEP VRGAETVWDG GWIVPGLVDA 
HCHVGLGPVP GGAVGIDEAA AQAETERAVG ALLLRDCGSP TDTRSLDDRD DLPRIIRAGR 
HVAKPKRYLA GYAVDVEDES QLPGIVAEQA RRGDGWVKLV GDWIDRSIGD LAPLWDDEIL 
EQAIAAAHAN GARVTAHVFG EDALPGLINA GIDCIEHGTG LTDDTIELMV ERGTALVPTL 
INLENFPGIA DQAAKYPTYA AHMRDLYQRS YARVAAAREA GVPIYAGTDA GSTIAHGRIG 
DEIDALRGIG MSATDALGAA CWDARTWLGR PGLVDGAPAD LVCYDEDPRL GSAVVNEPGL 
VILRGRVF