Gene RPC_0046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_0046
Symbol
ID	3971433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	52957
End bp	54102
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	70%
IMG OID	637923160
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_529944
Protein GI	90421574
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTACGCC GGGCAAGGAA AACGCCGTAT TGGCGGCAAA CGCAAGGGCT CAATTTGGCT 
ACCGATACAG CGTCTCTGGT GCTGGGGATC GAGACCACTT GCGACGAAAC CGCGGCCGCC 
GTGGTCGAGC GCCGCAGCGA TGGCAGCGGC CGCATCCTGT CCAACATCGT GCACTCGCAG 
ATCGAGGATC ACGCGCCGTT CGGCGGCGTG GTCCCCGAGA TCGCGGCGCG GGCGCATGTC 
GACCTGCTCG ACGGCATCAT CGCGCGTGCG ATGCAGCAGG CCGGCCTCGG CTTCAAGGAT 
CTTTCGGGCG TCGCCGCCGC CGCCGGGCCC GGCCTGATCG GCGGCGTCAT CGTCGGCCTC 
ACCACCGGCA AGGCGATCGC GCTGGTGCAC GATACGCCGT TGATCGCGGT CAACCATCTG 
GAAGCCCACG CGCTGACGCC GCGGCTGACC GACGCGCTGC AATTCCCCTA TTGCCTGTTT 
CTCGCCTCCG GCGGCCACAC CCAGATCGTC GCGGTGCTCG GCGTCGGCAA CTACGTCCGG 
CTCGGCACCA CCGTCGACGA CGCGATGGGC GAGGCCTTCG ACAAGGTCGC CAAGATGCTC 
GGGCTGCCCT ATCCGGGCGG GCCGCAGGTC GAGCGCGCCG CGGCGGCCGG CGACGCTGCG 
CGCTTTGCGT TTCCGCGGCC GATGCTGGGC CGCGCCGACG CCAATTTTTC GCTGTCCGGT 
CTGAAGACCG CGGTGCGCAA CGAGGCCAGC CGGCTATCGC CGCTTGAGCC GCAGGACGTC 
AACGATCTGT GCGCTGGATT CCAGGCCGCG GCGCTGGAAT CCACCGCCGA CCGGCTGCAT 
GTCGGCCTTC GGATATTTCG CGAGCGGTTC GGCGCGCCGC ACGCGCTGGT CGCCGCCGGT 
GGCGTCGCCG CCAATCAGGC GATCCGCGGC GCGTTGCAGC AGGTGGCCTT GGCCGCCGGC 
ACTCAATTCA TGATCCCCCC GCCGGCGCTA TGCACCGACA ACGGGGCGAT GATCGCCTGG 
GCCGGCGCCG AACGGCTGGC GCTGGGGTTG ACCGACAGCC TCGAATTCGC GCCGCGGGCG 
CGCTGGCTGC TCGACGCCAA CGTCATCACG CCGGCGCAAT TCGCCAACAC CCGCGCGGGC 
TTCTAG

Protein sequence

MLRRARKTPY WRQTQGLNLA TDTASLVLGI ETTCDETAAA VVERRSDGSG RILSNIVHSQ 
IEDHAPFGGV VPEIAARAHV DLLDGIIARA MQQAGLGFKD LSGVAAAAGP GLIGGVIVGL 
TTGKAIALVH DTPLIAVNHL EAHALTPRLT DALQFPYCLF LASGGHTQIV AVLGVGNYVR 
LGTTVDDAMG EAFDKVAKML GLPYPGGPQV ERAAAAGDAA RFAFPRPMLG RADANFSLSG 
LKTAVRNEAS RLSPLEPQDV NDLCAGFQAA ALESTADRLH VGLRIFRERF GAPHALVAAG 
GVAANQAIRG ALQQVALAAG TQFMIPPPAL CTDNGAMIAW AGAERLALGL TDSLEFAPRA 
RWLLDANVIT PAQFANTRAG F