Gene TM1040_2211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2211
Symbol
ID	4078202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2324203
End bp	2325363
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	69%
IMG OID	638007533
Product	precorrin-3B synthase
Protein accession	YP_614205
Protein GI	99082051
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0155] Sulfite reductase, beta subunit (hemoprotein)
TIGRFAM ID	[TIGR02435] precorrin-3B synthase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCC CTGCGCCCAA AGTCTATGGC TGGTGCCCCG GTGCGCTCAG GCCGATGATG 
TCCGGTGACG GGCTTGTGGT GCGCATTCGC GCGCCTATGG GGCGGCTCTC GCCGGAGCAG 
GCCGGGGCGG TGGCAGAGCT TTCCGCGCGG TATGGCAATG GTCTCCTAGA CCTTTCGGCA 
CGGGCAAACC TGCAGATGCG CGGCATCCAG GAGAACGATC ACCCGAACCT CATTGCAGCG 
CTGCAGGATT TGGGCCTTGT AGAAGCCGAC GCCAACGCCG AAGCGCGGCG CAATATCCTG 
CTCACCCCCT TCTGGCGCAG CGGCGACCGG AGCCACCAGA TCGCGCAGCG TCTTGCCGCG 
CTTCTGTCCG ACGCCACAAC CCTCGACCTG CCCGGCAAGT TTGGATTTGC AGTGGATGCA 
GGCGAGGCGC CCGTCTTGCA AGCGACCGCT GCCGACATTC GCATCGAAGG CGACGGCGAC 
CGCCTCATGC TGCGCGCTGA TGGCGCAGAT GTGGCGCTTG AGGTCACTGA GACTGAGGCC 
GCGGCCCAGG CCCTCGCACT TGCCCGCTGG TTCCTCGAGC AAGGCGGCGC GTCCGAGGGT 
CGAGGCCGGA TGCACGCGCT GATTTCGCGC CGCGGCGCCC CCGACACGCA TGGCGCAGAT 
GTGGCCAAGG GTGCCCCCCT GCCTGCCCCC GGCCTTACCA GAAACGGAGC GCTCGTGGCC 
CTCGAGTTTG GCCAGATCCA CGCAACGACC CTCGCGGCGC TCGCCAAACA TGGTGCCTTG 
CGCCTCACGC CGTGGCGCAT GCTGCTGGTC GAAGACGCCC GGGACATCAC GCCCCTGCCC 
GACCTTATTC TGGGTGCGAC GGATCCGCGC CTGCACGTGA GCGTCTGCAC CGGCGCGCCC 
GGGTGCCTGC AGGCGCTTTC GCAAACCCGC GACCTTGCCC GCGACCTCGC ACCGCATCTG 
CAGGCAGGCA CCCACCTGCA CGTCTCCGGC TGCGCCAAGG GCTGCGCCCA TCCCCGGCCT 
GCCGATGTGA CCCTGACCGC CACCGGCACA GACCGCTTTG ATCTCATCCG CAAGGGCCGC 
GCCAGCGACG CCCCCTTGCG TTCCGACCTC ACTGCGCGCA CCCTGCGCGC CGCGCCGCAC 
ATCCTGACGA AAGACACCTG A

Protein sequence

MSAPAPKVYG WCPGALRPMM SGDGLVVRIR APMGRLSPEQ AGAVAELSAR YGNGLLDLSA 
RANLQMRGIQ ENDHPNLIAA LQDLGLVEAD ANAEARRNIL LTPFWRSGDR SHQIAQRLAA 
LLSDATTLDL PGKFGFAVDA GEAPVLQATA ADIRIEGDGD RLMLRADGAD VALEVTETEA 
AAQALALARW FLEQGGASEG RGRMHALISR RGAPDTHGAD VAKGAPLPAP GLTRNGALVA 
LEFGQIHATT LAALAKHGAL RLTPWRMLLV EDARDITPLP DLILGATDPR LHVSVCTGAP 
GCLQALSQTR DLARDLAPHL QAGTHLHVSG CAKGCAHPRP ADVTLTATGT DRFDLIRKGR 
ASDAPLRSDL TARTLRAAPH ILTKDT