Gene RPC_3653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3653
Symbol
ID	3972025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	4066717
End bp	4068099
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	57%
IMG OID	637926763
Product	type I restriction enzyme StySPI specificity protein
Protein accession	YP_533507
Protein GI	90425137
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.234587
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.701676
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGGTG ATCTTCCAAG CGGATGGGTC GCCGCACCAA TTGACGACCT TCGTGCGCTT 
GAGCCCAATG CTATCACTGA TGGTCCCTAT GGCAGCAGTC TCAAGACGAG CCATTACCGA 
TCGAGCGGCG CTCGTGTGGT CCGTCTAGGC AATATCGGTT TTCGCAGATT CTTGAGTGCT 
GATGCGGTAT ACATTTCTGA GGATCACTTC AAGGCCCTGG TAAAGCATCA CGTCAGGGCC 
GGAGACGTGT TGATTGCCGC GTTGGGTGAC CCGGTAGGTC GTTCTTGCAT TGCCCCGTCT 
GATATTTCGC CGGCGTTGGT GAAGGCAGAT TGCTTTCGTC TTCGTTGTTC GCCTCACCTT 
TCAGCGCCAT TCATAATGCT TTGGTTGAAC TCGGAGTGCG CACGCGAAGC TTTTTCAAGC 
GCAGCTCACG GACTTGGACG TGTGCGCATT AACCTATCTG ATTTTCGAAC GACTGTAGTA 
CCTGTTCCTC CAGCGACTGA GCAAGGGCGC ATCGTCGCTA AGATCGACAA CCTGTCCGCA 
AAGTCCAAAC GCTCCCGCGA TCACCTCGAC CACATCCCCC AGTTGGTCGA GAAGTACAAG 
CAGGCGATCT TGGCGGCGGC GTTTCGTGGC GAGCTGACGC ACGAGTGGCG TGTCAATAAC 
CTCGACCAAA AGTGGCCGTG GCCGGAATGC TCACTGTCGG ATATAGCAAA CATCGGGACG 
GGAGCGACCC CTAAGCGCGG CGAGCAACGC TATTACAGCA ACGGGAACAT TCCGTGGATA 
ACCAGCGGCG CCGTAAAACA CGCGGTGGTG CAGGCCGCTG ATGAATACAT CACGGAGGCC 
GCAGTACGCG AGACAAACTG CAAGGTATTT CCGGCAGGAA CGATCTTGAT GGCAATGTAC 
GGAGAAGGCA AAACGCGAGG CCGTGTAACG GTGCTTGGTA TCAACGCAGC AACAAATCAG 
GCCGTAGCTG CTATTCAGGT CAGGGCCGAC AGTCCCGCAG TTCGAGACTT CGTCGTTTGG 
CACTTACGCA GCGGATACCT CGAACTTCGT GAAAGGGCGG CAGGTGGGGT TCAACCCAAT 
CTCAATCTCG GAATTGTCAA TGCGTGGCGC ATACCGTTGC CCTCTCGTGA TGAACAGATG 
GAAGTAGTAC GTCGAGTGCA AAAGGCCTTT GCCTGGATCG ACCGTCTCAC CATCGAAACC 
ACCAGCGCAC GCAAGCTGAT CGACCGCCTC GACCAAGCCA TCCTCGCCAA GGCATTCCGG 
GGCGAGTTGG TACCGCAGGA CCCGAACGAC GAACCGGCGA GCATCCTCTT AGAGCGCATC 
AAGGCCAAAC GCGCGGGCAG TGCTGGGCAC ACCCGGCGAC GTTCTGCGCG GGCCACTTCG 
TGA

Protein sequence

MTGDLPSGWV AAPIDDLRAL EPNAITDGPY GSSLKTSHYR SSGARVVRLG NIGFRRFLSA 
DAVYISEDHF KALVKHHVRA GDVLIAALGD PVGRSCIAPS DISPALVKAD CFRLRCSPHL 
SAPFIMLWLN SECAREAFSS AAHGLGRVRI NLSDFRTTVV PVPPATEQGR IVAKIDNLSA 
KSKRSRDHLD HIPQLVEKYK QAILAAAFRG ELTHEWRVNN LDQKWPWPEC SLSDIANIGT 
GATPKRGEQR YYSNGNIPWI TSGAVKHAVV QAADEYITEA AVRETNCKVF PAGTILMAMY 
GEGKTRGRVT VLGINAATNQ AVAAIQVRAD SPAVRDFVVW HLRSGYLELR ERAAGGVQPN 
LNLGIVNAWR IPLPSRDEQM EVVRRVQKAF AWIDRLTIET TSARKLIDRL DQAILAKAFR 
GELVPQDPND EPASILLERI KAKRAGSAGH TRRRSARATS