Gene M446_1654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_1654
Symbol
ID	6129065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	1849789
End bp	1850991
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	76%
IMG OID	641641912
Product	imidazolonepropionase
Protein accession	YP_001768581
Protein GI	170739926
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID	[TIGR01224] imidazolonepropionase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0408106
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0708418
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTGCG ACCGCCTGTG GCGCAACGCC CGGCTCGCCA CCCTGGCCGA GGGGGCGCCG 
GGGCTCGGCC TCGTGGAGGA CGGGCTGATC GCCGCCCGCG ACGGGCGCAT CCTCTACGCG 
GGGCCGGCGC GGGCGGCGCC CGCCTTCGCG GCCCGCGAGA CGGTCGATTG CGAGGGGCGC 
TGGATCACCC CGGGCCTGAT CGACTGCCAC ACCCACCTCG TCCACGGCGG CGACCGGGCG 
GCGGAGTTCG AGGCGCGGCT CGCCGGCGCC AGCTACGAGG AGATCGCGCG GGCGGGCGGC 
GGCATCGTCT CGACCGTGCG CGCCACCCGG GCGGCGAGCG AGGACGCGCT CGTCGGGAGC 
GCGCTGCGGC GCCTCGACGC GCTGATCGCC GAGGGCGTGA CCGCGGTCGA GGTGAAGTCC 
GGCTACGGCC TCTCCGTCGC CTCCGAGCGC GCGAGCCTGC GGGCGGCCCG CCGCCTCGGG 
GAGAGCCGCG ACGTCACCGT GACCACGACC TTCCTGGGTG CCCACGCGCT GCCGCCGGAG 
GAGCCCGACA AGGACCGCTA CATCGCGCAT GTCTGCACCG AGATGCTGCC CGCCCTGGCG 
CGGGAGGGGC TGGCCGACGC GGTCGACGCC TTCTGCGAGG GGATCGCCTT CTCGCCCGCC 
CAGACCGCGC GGGTCTTCGA GGCGGCGCGG GCGGCGGGCC TGCCGGTGAA GCTGCACGCC 
GACCAGCTCT CCGATCTCGG CGGGGCGGCG CTGGCGGCGC GGTTCGGCGC CCTCTCGGCC 
GACCACCTGG AATACGCGGA CGAGGCCGGC GCCGCCGCCC TGGCCCGGGC CGGCACCGTG 
GCGGTGCTGC TGCCGGGGGC CTTCTACTTC ATCCGGGAGA CGCGGCGGCC GCCCGTCGAC 
CTGTTCCGCC GCCACGGCAC GCGGATGGCG CTCGCCACCG ACTGCAATCC CGGCACCTCC 
CCCCTCACCT CCCTGCTCCT CGTGCTCAAC ATGGGCGCGA CGCTGTTCCG GCTCACCGTC 
GAGGAATGCC TCGCGGGCGT GACCCGGGAG GCGGCCCGCG CCCTCGGGCG CCTGCACGAG 
ATCGGCACGC TGGAGGCGGG CAAGTGGTGC GACCTCGCGG TCTGGGACGT CGAGCGCCCG 
GCCGAACTCG TCTACCGCAT GGGATTCAAC CCGCTGCACG CCCGCATCCG GAGGGGCCGA 
TGA

Protein sequence

MLCDRLWRNA RLATLAEGAP GLGLVEDGLI AARDGRILYA GPARAAPAFA ARETVDCEGR 
WITPGLIDCH THLVHGGDRA AEFEARLAGA SYEEIARAGG GIVSTVRATR AASEDALVGS 
ALRRLDALIA EGVTAVEVKS GYGLSVASER ASLRAARRLG ESRDVTVTTT FLGAHALPPE 
EPDKDRYIAH VCTEMLPALA REGLADAVDA FCEGIAFSPA QTARVFEAAR AAGLPVKLHA 
DQLSDLGGAA LAARFGALSA DHLEYADEAG AAALARAGTV AVLLPGAFYF IRETRRPPVD 
LFRRHGTRMA LATDCNPGTS PLTSLLLVLN MGATLFRLTV EECLAGVTRE AARALGRLHE 
IGTLEAGKWC DLAVWDVERP AELVYRMGFN PLHARIRRGR