Gene Mnod_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_1039
Symbol
ID	7302583
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	-
Start bp	1111445
End bp	1112647
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	73%
IMG OID	643598788
Product	imidazolonepropionase
Protein accession	YP_002496350
Protein GI	220921049
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID	[TIGR01224] imidazolonepropionase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.017849
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGTGCG ACCGCCTCTG GCACAACGCC CGGCTCGCCA CCCTGGCTGA AAGCCGGCCC 
GGCCTCGGTC TCGTGGAGGA TGGGGTGATC GCTGCCCGCG ACGGGCGCAT CCTTCATGCG 
GGGCCCACCG CGGAGGCACC GTCCTTCGCG GCGCGCGAGA CGATCGACTG CGAGGGCCGC 
TGGATCACCC CGGGGCTGAT CGACTGCCAC ACCCACCTCG TCTTCGGCGG CGACCGGGCG 
CAGGAATTCG AGGCGCGCCT CGCGGGCGCC AGCTACGAGG AGATTGCGCG GGCAGGCGGC 
GGCATCGTGT CGACGGTGCG GGCGACGCGG GCGGCCTCGG AGGACGATCT CGTGGCGGGC 
GCGCTCCGGC GCCTCGACGC GCTGATCGCC GAGGGCGTGA CCACGGTCGA GGTGAAGTCC 
GGCTACGGCC TCTCCCTCGC GGCGGAGCGC GCGAGCCTGC GGGCTGCTCG GCGGCTCGGG 
GCGGAGCGCG ACGTCACGGT GACGACCACT TTCCTCGGCG CCCACGCCCT GCCGCCCGAG 
GAGAGCGACC GGGACCGCTT CATCGACCGC ATCTGCGCGG AGATGCTGCC GGCGATCGCG 
CAGGAGGGCC TCGCCGACGC GGTCGATGCC TTCTGCGAGG GGATCGCCTT CTCGCCGGTT 
GAGACCGCGC GGGTGTTCGA GGCCGCGCGG GACGCGGGGC TGCCGGTGAA GCTCCACGCC 
GATCAGCTCT CGAATCTCGG CGGGGCGGCG CTCGCGGCCC GCTTCGGCGC GCTCTCGGCC 
GACCATCTGG AATATACGGA CGAGGCCGGG GCCGCCGCGA TGGCTCAGGC CGGCACCGTC 
GCGGTGCTCC TGCCCGGCGC CTTCTACTTC ATCCGGGAAA CCAAGGTGCC GCCGGTCGAC 
CTGTTTCGCC GCCACGGCAC CCGGATCGCG CTCGCCACCG ACTGCAATCC CGGCACCTCG 
CCGCTGACCT CGCTGCTCCT CGTCCTCAAC ATGGGCGCGA CGCTGTTCCG CCTCACGGTC 
GAGGAATGCC TCGCGGGCGT CACCCGGGAG GCGGCGCGGG CGCTCGGGCG CCTGCACGAC 
CTCGGCACGC TGGAAGCGGG CAAGTGGTGC GACCTCGCCA TCTGGGACAT CGAGCGCCCG 
GCCGAACTCG TCTACCGCAT GGGCTTCAAT CCGCTCCATG CCCGCATCCG GAGGGGCCGA 
TGA

Protein sequence

MQCDRLWHNA RLATLAESRP GLGLVEDGVI AARDGRILHA GPTAEAPSFA ARETIDCEGR 
WITPGLIDCH THLVFGGDRA QEFEARLAGA SYEEIARAGG GIVSTVRATR AASEDDLVAG 
ALRRLDALIA EGVTTVEVKS GYGLSLAAER ASLRAARRLG AERDVTVTTT FLGAHALPPE 
ESDRDRFIDR ICAEMLPAIA QEGLADAVDA FCEGIAFSPV ETARVFEAAR DAGLPVKLHA 
DQLSNLGGAA LAARFGALSA DHLEYTDEAG AAAMAQAGTV AVLLPGAFYF IRETKVPPVD 
LFRRHGTRIA LATDCNPGTS PLTSLLLVLN MGATLFRLTV EECLAGVTRE AARALGRLHD 
LGTLEAGKWC DLAIWDIERP AELVYRMGFN PLHARIRRGR