Gene RPC_2031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_2031
Symbol
ID	3973931
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	2212904
End bp	2214349
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	65%
IMG OID	637925140
Product	radical SAM family protein
Protein accession	YP_531905
Protein GI	90423535
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCTG AATCTGATGA AGCGTCGCCA ATCATTCACA TCGTTCCGTT GGGAGATCCA 
CGGCGTGCCG CCGCGATCCA TCCCGGCAGT GGGGCCTGGG TTCTGATCGA AGATGCGGAC 
ATGCCGGGGC TCGGACTTCG GGGTGATACG GTGAATCCGG TCGAACTAGC ACCGACGCAT 
CCGCTCTATG CGGGCGTGCT TGACGCCACC CTGGGCTATC GCTCCGCCGC GTTGCAGCGC 
TGCGAGCCGA AGTTGGACAC CCTGATCCTG AAGGTGACCA ACCGTTGCAA CGAGGCCTGC 
AGACATTGCT ACGACGCCGG CGGGCGGGCC GAGATGGACG CCGCGATCGA CACGTTGTTC 
GACGCGACGG ACGAGGCGCT GGTGCTATGC GGACCGACGT TGAACCTTTT GTTCCACGGC 
GGCGAGCCGT TTCTCCGGAT CGATGTTCTC GATCGCGTCG CCGCTCACGC GCGCGATCAG 
GCTGCCGGTC TCGGCAAGCA GGTCGGCGTG TTCGTGCAGA CCAACGCCTC GATCCTGAAT 
GACAGGATCA TCGGCATTCT GCAGAAGCAT CACTTCGGCG TCGGCGTGTC GCTCGACGGC 
TGGGCCGAGC TGCACGATCA GATGCGGGTG ATGGCCGACG GCACCGGCAC CTACCGATTG 
TTCGAACGCT CCTACCGCCG CTACGCGCAT TACCTGACGG CCCATGCGGG AATCATGACG 
ACGGTGATGG CCTGCAATGT CGGGGCGTTG CCGGAAATCG TTCGGCATGT CCGTGACCTC 
GGCTTCCGGA CATGGGACGC CACGCTGTTC GATCTCAGCG GAAAAGGCGC GCTGTATCCG 
CAGCTCGCCG TGGGCGGCGA GGCGTATAGC GCGGCGCTGG AGCCGATCCT CGACCTGATC 
GAAGCCGGGG AGTGCGACGA GATTGCGATC AAGCCGGTGC TGCGCCGACT CGACAATCTG 
CTGTCGCCGC GTCGCGACGA TATGTGCCTG CCTGGAAACG GTCCCTGCGG CGCCGGCGGC 
CGGCTGTTGT CGCTGTCGGC CGAAAACATC GTGCATGGCT GCGACATCAT CGACCGTGCC 
TCGCTGCGCC TGGGGGTGTT TCCGGCCACC ACGTTCGGCG CGGCCCTGGC GTCACCTCAG 
GCGGCTATCA TGCGAAGCAG GCCGTCGCGA CTTGCGGCCT GCCACCGATG CACCTGGTTC 
GGCCTGTGCG GCGGCACCTG CCTTGCCAGA GGCTCGCTGA ACGCACCGGA TTCCACAGAG 
TGCCTGGTGT CGAAGCGGAT CAACCACAGC CTACTGCGGC GCATCGCACG GAGCGACCGG 
CTGCTCGACT GGTATGAACG TTACCCGCCG GATCGCCGCC GCGCGTCGAT CATCTCCGAA 
ACCGCAAACC GTGCGGCCGC ATCGCATCCG GTCAACACGG CCCAACGACC CAGGAGCGTC 
AGTTGA

Protein sequence

MSSESDEASP IIHIVPLGDP RRAAAIHPGS GAWVLIEDAD MPGLGLRGDT VNPVELAPTH 
PLYAGVLDAT LGYRSAALQR CEPKLDTLIL KVTNRCNEAC RHCYDAGGRA EMDAAIDTLF 
DATDEALVLC GPTLNLLFHG GEPFLRIDVL DRVAAHARDQ AAGLGKQVGV FVQTNASILN 
DRIIGILQKH HFGVGVSLDG WAELHDQMRV MADGTGTYRL FERSYRRYAH YLTAHAGIMT 
TVMACNVGAL PEIVRHVRDL GFRTWDATLF DLSGKGALYP QLAVGGEAYS AALEPILDLI 
EAGECDEIAI KPVLRRLDNL LSPRRDDMCL PGNGPCGAGG RLLSLSAENI VHGCDIIDRA 
SLRLGVFPAT TFGAALASPQ AAIMRSRPSR LAACHRCTWF GLCGGTCLAR GSLNAPDSTE 
CLVSKRINHS LLRRIARSDR LLDWYERYPP DRRRASIISE TANRAAASHP VNTAQRPRSV 
S