Gene M446_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_1039
Symbol
ID	6131383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	1154219
End bp	1155292
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	76%
IMG OID	641641332
Product	uroporphyrinogen decarboxylase
Protein accession	YP_001768004
Protein GI	170739349
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGAGA GCGAGCGCGA GGCGCGGCCG GTCCTGCGGG TTCTGAGCGG CGAGAGCCTG 
TCCCCTCCTC CGGCCTGGAT GATGCGGCAG GCGGGCCGCT ACCTGCCGGA ATACCGGGAG 
CTGCGGGCGA AGGCCGGCTC CTTCCTCGAC CTCTGCTACA CGCCGGATTT CGCCACCGAG 
GTCACGCTGC AGCCGATCCG CCGCTTCGGC TTCGAGGCGG CGATCCTGTT CTCCGACATC 
CTGGTGGTGC CCCACGCCCT CGGCCAGGGC GTGCGCTTCG TCGAGGGCGA GGGGCCGCGC 
CTCGACGCGC TCGAGGACCC GGCGGCGTTC GGGACCCTGC GCGGGGCCGG CGACGCGCGG 
GTGATGGACC ACCTCGCCCC GGTCTTCGAG ACGGTGAGCC GCCTGCGCGC GGCGCTGCCC 
CGCGAGACCA CCCTGCTCGG CTTCTGCGGC GCGCCCTGGA CGGTGGCGAG CTACATGATC 
GGCGGGCGCG GCACCCCCGA CCTCGCCCCG GCCCGCGCCC TGGCGGCCCG GGATCCGGCG 
CTCCTCGACG GGCTGATCGA GCGGCTCGTC GCGGTCTCGA CCGAGTACCT CGCCCGCCAG 
ATCGAGGCGG GGGCGGACGC CGTGCAGATC TTCGAGAGCC ACGGCGGCAC CCTGCCGGGG 
ATGCCGGAGG GCGAGGCCGG CGACGCGCTC ACCCGCTGGA GCCTCGGGCC GATCGCCCGG 
ATCGTCGCCG GCCTGCGGGC GCGGGTGCCG GGGGCGCGCG TCATCGTCTT CCCGCGCGGC 
ACCGGCCTCG ACGGCCATGC CCGGACGCTC GCCGCGACCG GCGCCGACGC GGTCGGGGTC 
GACTGGGACG TGGACCTCGC TGCCCTGCGC GGGCGGCTGC CGGGGCGCGC CGTCACCCAG 
GGCAACCTGC ATCCCCACAC GCTGATCGCG GGCGGGGCGG CGCTCGACGC GGCGGTCGAC 
GCGATCCTCG CCGCGACCGC GGGCCTGCCC CACATCTTCA ATCTCGGCCA CGGCATCACG 
CCGGAGACGC CGATCGCCCA TGTCGAGCGC ATGCTCGCGC GGCTGCGGCG CTGA

Protein sequence

MGESEREARP VLRVLSGESL SPPPAWMMRQ AGRYLPEYRE LRAKAGSFLD LCYTPDFATE 
VTLQPIRRFG FEAAILFSDI LVVPHALGQG VRFVEGEGPR LDALEDPAAF GTLRGAGDAR 
VMDHLAPVFE TVSRLRAALP RETTLLGFCG APWTVASYMI GGRGTPDLAP ARALAARDPA 
LLDGLIERLV AVSTEYLARQ IEAGADAVQI FESHGGTLPG MPEGEAGDAL TRWSLGPIAR 
IVAGLRARVP GARVIVFPRG TGLDGHARTL AATGADAVGV DWDVDLAALR GRLPGRAVTQ 
GNLHPHTLIA GGAALDAAVD AILAATAGLP HIFNLGHGIT PETPIAHVER MLARLRR