Gene Sare_3920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3920
Symbol
ID	5703771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4462384
End bp	4463643
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	75%
IMG OID	641273345
Product	uroporphyrin-III C-methyltransferase
Protein accession	YP_001538702
Protein GI	159039449
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0007] Uroporphyrinogen-III methylase [COG1648] Siroheme synthase (precorrin-2 oxidase/ferrochelatase domain)
TIGRFAM ID	[TIGR01469] uroporphyrin-III C-methyltransferase [TIGR01470] siroheme synthase, N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.797973
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.18472
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGCCA ACCCGTACCC GCTCGGGCTG CGCCTGGCCG GCCGTAGGGT GGTCGTGGTC 
GGTGGGGGAG CGGTCGCCAC CCGCCGAGTG CCGGCCCTGC TCGACGCGGG CGCGGACGTC 
CTCCTGGTCG CACCGGAGCT GACCCCGGCG CTGCGCGCCC ACGCCGACGC TGGTCGGTTG 
CACTGGGCGC GGCGACGGTT CGCGGTGGAC GACCTCGATG GTGCCTGGCT GGTGCAGGTG 
GCGGTGAACG ACCCGATCGC CGCCGCCGCG GTCAGCGCGG CGGCCGGCGA GCGGCGGATC 
TTCTGTGTCC GCGCCGATGA TCGCGCCGCC GCCACTGCCT GGACCCCGGC GGTCACCCGG 
CAGGGTCCGG TGACGGTGGC GGTCCTCGGC GGCGGCGACC CCCGGCGCGC GATGGCCGTC 
CGGGATGCCG TCCGGGACCT GCTCGCTGCC GGAGCCGGAC CGCTGGCCCC GCCCTCGACA 
ACCGGTGACG GGACCGCTGG TGCTCCGGGG CGCGCACCCT CGACCACCGC CCGCGGCGGG 
CGCGTCGCCC TGGTCGGCGC TGGACCGGGC GACCCGGAGC TGATCACGGT CAAGGGGCGA 
CGGCTGCTCA CCGAGGCGGA CGTGGTGGTT GCCGACCGGC TGGTGCCAGG CCTCCTTCTG 
GACGAGTTGC GCCCCGAGGT CGAACTGGTC GACGCGGCCA AGATTCCCTA CGGCCCGGCC 
CGTGCCCAGG AGGAGATCAA CCGTGTCCTG GTCGACCGGG CTCTGGCCGG CAAGGCCGTG 
GTCCGGCTCA AGGGCGGCGA CCCATACGTC TTCGGTCGTG GGGGCGAGGA ACTGCTGGCC 
TGCGCCGCGG CGGGCGTACC GGTGACGGTG GTGTCCGGGG TGACCAGCGC GATTGCTGCG 
CCAGCGGGCG CCGGTGTCCC GGTCACCCAC CGGGCGGTGG CGCACGAGTT CACCGTGGTG 
TCCGGGCACG TTCCGCCGGA CTCGCCGGCC TCGATGGTGC GCTGGGAGCA CCTCGCCGGG 
CTGCGCGGCA CGCTGGCGAT CATGATGGGG TTGAAGAATC TGGGGGCGAT CTCCGCGACG 
TTGGTCACCC ACGGCCGCCC CGCGGACACC CCGGCGGTGG TCGTGCAAGA GGGCACGACC 
GGCGATCAGC GTACGGTCCG CTCGACGCTC GGCGGGGTGG CCGTCGATGT GGCCGCGGCG 
GGCCTCCGTC CCCCGGCGGT CGTGCTGATC GGCGACGTGG TCGGGGTCCT GGACACCTGA

Protein sequence

MSANPYPLGL RLAGRRVVVV GGGAVATRRV PALLDAGADV LLVAPELTPA LRAHADAGRL 
HWARRRFAVD DLDGAWLVQV AVNDPIAAAA VSAAAGERRI FCVRADDRAA ATAWTPAVTR 
QGPVTVAVLG GGDPRRAMAV RDAVRDLLAA GAGPLAPPST TGDGTAGAPG RAPSTTARGG 
RVALVGAGPG DPELITVKGR RLLTEADVVV ADRLVPGLLL DELRPEVELV DAAKIPYGPA 
RAQEEINRVL VDRALAGKAV VRLKGGDPYV FGRGGEELLA CAAAGVPVTV VSGVTSAIAA 
PAGAGVPVTH RAVAHEFTVV SGHVPPDSPA SMVRWEHLAG LRGTLAIMMG LKNLGAISAT 
LVTHGRPADT PAVVVQEGTT GDQRTVRSTL GGVAVDVAAA GLRPPAVVLI GDVVGVLDT