Gene RPC_4488 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4488
Symbol
ID	3972403
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4997120
End bp	4998019
Gene Length	900 bp
Protein Length	299 aa
Translation table	11
GC content	63%
IMG OID	637927599
Product	CRISPR-associated Cas1 family protein
Protein accession	YP_534330
Protein GI	90425960
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1 [TIGR03639] CRISPR-associated endonuclease Cas1, NMENI subtype

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.155164
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.116013
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTGGC GAGGCCTGCA CCTGACGCAG GCGGCAAGGC TGTCGCTTGC CGACGGTCAG 
GTTTGCGTCA GACAGGATGC GGGCGAAGTG CGGCTCGCAC TGGAAGATAT TGCCTGGATC 
GTGATCGACA CGCCGCAGGC GACGCTGTCG AGCGCGCTGA TGAGTGCGTG CATGGACGCC 
GGCGTCGTGC TGATCTTTAC CGACGAGCGG CACACGCCAT CGGGCGTTGC CTTGCCGTTT 
CATCGTCACC ATCGCCAGGG CGCGATCGCG AAGCTTCAGT TCGACGCCAA GGACGGCGTG 
AAGCGGCGGC TGTGGCAAGC CATCATTCGC CGCAAGATTC TCAATCAGGC GGCTTCGCTC 
TCGGTTCTTA ACCGCCAGAA TTCAGAGACT CTCGCGGAGA TTGCGCGTCA TGTCGAGCCG 
GGCGATCCGG AGAACGTCGA GGCCCGCGCG GCGCGCTTCT ATTGGGGCCG TCTGTTTGGG 
GATTTCGTGC GCGACGACGA GGGTGATCTT CGCAACAAAA TGCTGAACTA CGGTTATGCC 
GTCATGCGCG CCGGCGTTGC GCGGGCGCTG GTCGCCTGCG GATTTCTTCC GGCGTTCGGT 
TTGAAGCACG AGAGCGCGGC CAATGCTTTC AACCTCGCGG ACGATATCGT CGAGCCGTTC 
CGGCCGTTTG TCGATGGTCT CGCATGGACG ACTCTCGGTG ATCGCGTGGC CAAGAACGGC 
GATCTCACGC TGGATGACCG TCGCGCCATG GCCGGCGTGC TGCTGATGAA TGGCCGGGTC 
GGGGACGCCA AGGTGTCGCT TCTGGTTGCC GCGGAAATGG CCTCCGCCAG CCTCTGCCGT 
GCGCTGGAGT TCGAAAAGCC GGCGTTGCTC GAATTGCCGG AATTGGAGCG CATTTCATGA

Protein sequence

MAWRGLHLTQ AARLSLADGQ VCVRQDAGEV RLALEDIAWI VIDTPQATLS SALMSACMDA 
GVVLIFTDER HTPSGVALPF HRHHRQGAIA KLQFDAKDGV KRRLWQAIIR RKILNQAASL 
SVLNRQNSET LAEIARHVEP GDPENVEARA ARFYWGRLFG DFVRDDEGDL RNKMLNYGYA 
VMRAGVARAL VACGFLPAFG LKHESAANAF NLADDIVEPF RPFVDGLAWT TLGDRVAKNG 
DLTLDDRRAM AGVLLMNGRV GDAKVSLLVA AEMASASLCR ALEFEKPALL ELPELERIS