Gene Mpe_A3000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3000
Symbol
ID	4784689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	3189825
End bp	3190847
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	73%
IMG OID	640091571
Product	putative uroporphyrin-III methylase
Protein accession	YP_001022188
Protein GI	124268184
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2959] Uncharacterized enzyme of heme biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0501277
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCAGTTGG GGCTGATGCT GCTGCTGTTG CTGGTCAGCG TGACCGCACT GTCGATGGCC 
TGGTACGGCC AGCGCCGGGT GCGCACGCTG GAGCAGGAGC TGGTTCGACG CCAGCAGGAC 
AGCGCCGGTC AGGCCGCCGA GGCCCAGCTG CTGGCCAAGC AGGCCCAGGA GCTGTCGCGC 
GACGCGGTGG CCAAGGTCAC GCTGACGGAG AGCCGGTTGG CCGAGATCAC CGCGCAGCGT 
GGCCAGCTCG AAGAACTGAT CCAGTCGCTG TCGCGTGCAC GGGACGAGAA CCTGGTGGTC 
GACATCGATG CCGGCATCCG CGTCGCGCTG CAGCAGACCG CCATCACCGG CAGCGCCGCG 
CCGCTGGTGG CGGCGCTGAA GGCGGCCGAC GAGCGCCTCG CGCGCGTCAG CCAGCCGCGG 
CTCGAACCGG TGCGACGCGC GATCGCGCGC GACCTCGATC GCGTCAAGGC CGTGAGCGTG 
GCCGACATCG CCTCGCTGGC GATCAAGCTC GACGAGGCCG CGCGGCTGGT CGACGAGGCG 
CCGCTGCAGG TGCTCGATCC GCAGCGCCTG GCCGAAGCGA AGGCGCCGCG TGCGGTCGCG 
CGCGTTGCCC CCTCGCCGGC CAGTGCCGCA GCGTCGGCGG CTCCGGTCGG CGGCCTGCGC 
GCGGAACTGG GCGACTGGTG GCAGGGCCTG TGGGCGGAGA CGCGCACCCT GCTGCGCGTG 
ACGCGCATCG ACCAGCCGCA GGCCATGCTG CTGGCGCCCG AGCAGGGATT CTTCCTGCGC 
GAGAACCTCA AGCTCCGGTT GCTCAACGCG CGGCTGGCAT TGATGAGTCG CCAGTTCGAC 
ACGGCGCAGT CCGATCTGCA GGCTGCGGTC GCGGCCGTCG ACAACTACTT CGACCGCGGC 
GCGCGCAAGA CGCAGTTGCT GACCGAACTG CTGCGCAGCG TGGTGCCGCA GGCGCGCCAG 
GCCGGCGTGC CGCGCCCGGA CGACACGCTG GCGGCGCTGA CGACCGCGGC GGCGGGCCGC 
TGA

Protein sequence

MQLGLMLLLL LVSVTALSMA WYGQRRVRTL EQELVRRQQD SAGQAAEAQL LAKQAQELSR 
DAVAKVTLTE SRLAEITAQR GQLEELIQSL SRARDENLVV DIDAGIRVAL QQTAITGSAA 
PLVAALKAAD ERLARVSQPR LEPVRRAIAR DLDRVKAVSV ADIASLAIKL DEAARLVDEA 
PLQVLDPQRL AEAKAPRAVA RVAPSPASAA ASAAPVGGLR AELGDWWQGL WAETRTLLRV 
TRIDQPQAML LAPEQGFFLR ENLKLRLLNA RLALMSRQFD TAQSDLQAAV AAVDNYFDRG 
ARKTQLLTEL LRSVVPQARQ AGVPRPDDTL AALTTAAAGR