Gene Msil_3024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3024
Symbol
ID	7093519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	3336280
End bp	3337797
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	68%
IMG OID	643466334
Product	uroporphyrin-III C-methyltransferase
Protein accession	YP_002363296
Protein GI	217979149
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0007] Uroporphyrinogen-III methylase [COG1648] Siroheme synthase (precorrin-2 oxidase/ferrochelatase domain)
TIGRFAM ID	[TIGR01469] uroporphyrin-III C-methyltransferase [TIGR01470] siroheme synthase, N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAAACC GGCGCTCAAA AGATGTTTCG AGCGAAGACT ATGACGAAAG CGTCGCCATG 
AACAGGACGT CGGCCGCTCC CGAGCCGGGC CGCCCGATCA TGACCGGGCT GGCGTCGCTG 
CCGGTGTTCT TCAACGTGAG GGGCAGGCGC GTCGTTATCG CTGGCGGGTC CGAGGCCGCC 
TTGTGGAAAG CCGAGCTTGT TCAGGCGGCG GGAGCGTCTG TGGTGGTTTT TGCCGCCGCC 
CCTTGCGACG GATTGGCGGA GCTTGAGCGC CGAGGCGCTT CGGTCGCGCT AGTGCGCCGC 
CGCTTCGAGC CTGGCGATTT GGACGGCGCG GTTCTCGCAC TCGCCGACTG CGATATCGCC 
GAAGAGGCGG AGCAGTTTCA CGCCGCCGCG CGGGCGCGCG GCGTTCCGGC GAATGTGATC 
GACAAGCCTG CCGCCTCCGA TTTTCAGTTC GGCGCAATCG TCGACCGCTC GCCTTTGGTC 
ATCGCCATCT CGACCGACGG CGCCTCGCCC ATTCTCGGAC AGGCTTTGCG CGGCCGCATC 
GAGGCCATGC TGCCAGCGGC GATCCGGCTT TGGGCCGGCG CCGCGAAATC CTGGCGCGCG 
CCGCTAAAGG CATTGGAGCT CGCTCCAAAA TTGCGCCGGC GATTTTGGGA GCTCTTCAAC 
GAGCGGGCTT TGACGGCGAG CGCCGTGCCG CCAGGCCCCG ATGAATTTAA ATCCTTGCTG 
GCGGAGGCGA CGGCTGAGGG TCCGCGCGCG GCGAAGGGCT CCATCGCCCT CGTCGGGGCA 
GGCCCCGGCG ATCCGGAACT GCTGACGCTG AAAGCCTTGC GCCTGCTGCA AGCGGCGGAT 
GTCGTGCTCT ATGACGATCT TGTCGCGCCC GAGATTCTCG ATATGGGCCG CCGCGAGGCG 
ACAAAAATCC CGGTCGGCAA GCGCGGCTAT CGGCCGTCCT GCAAGCAGGA CGACATCATC 
GATCTGATGA TCAAGCTCGC GGCGGAAGGC AAGCGGGTGG TGCGGCTCAA AGGCGGAGAT 
CCGATGATTT TCGGGCGCGC CAGCGAGGAG CTTGCCGCCC TTCACGCCGC AGGAATCGCG 
ACCAGCGTTA CGCCCGGCGT TACGGCGGCC CTTGGCGCCG CCGCCTCGCT GCAACTCTCG 
CTGACCGAAC GCGTGCGGGC GCGGCGGTTG CAATTCATCA CCGCTCACGC CCATGACGGA 
AGGCTGCCGG AAGACATCGA CTGGCGCGCG CTGGCCGATC CCTGCGCCTC CAGCGTCATT 
TACATGGGCG CGCGAACGCT CAACTCCCTC GTCGAGCGTC TGGCGGCGCA TGGGGCGGAC 
CCTTCGACGC CCGCGCTTCT CGTCGAGCGC GCGACCTGCC CGGACGAGCG CGTGATCAGG 
GGAACGCTGG CGAGCCTGCC CGCGAAAGCC GCCGCGCTGT CGCCGTCCGG GCCTTGCCTG 
ATCCTGATCG GCGCCGTCTT CGCCGGCGGC GTCGAGGCAG AGCAGATTCG GGAGGCGGCC 
GATATTGCGA TCGCCTGA

Protein sequence

MRNRRSKDVS SEDYDESVAM NRTSAAPEPG RPIMTGLASL PVFFNVRGRR VVIAGGSEAA 
LWKAELVQAA GASVVVFAAA PCDGLAELER RGASVALVRR RFEPGDLDGA VLALADCDIA 
EEAEQFHAAA RARGVPANVI DKPAASDFQF GAIVDRSPLV IAISTDGASP ILGQALRGRI 
EAMLPAAIRL WAGAAKSWRA PLKALELAPK LRRRFWELFN ERALTASAVP PGPDEFKSLL 
AEATAEGPRA AKGSIALVGA GPGDPELLTL KALRLLQAAD VVLYDDLVAP EILDMGRREA 
TKIPVGKRGY RPSCKQDDII DLMIKLAAEG KRVVRLKGGD PMIFGRASEE LAALHAAGIA 
TSVTPGVTAA LGAAASLQLS LTERVRARRL QFITAHAHDG RLPEDIDWRA LADPCASSVI 
YMGARTLNSL VERLAAHGAD PSTPALLVER ATCPDERVIR GTLASLPAKA AALSPSGPCL 
ILIGAVFAGG VEAEQIREAA DIAIA