Gene RPD_0003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0003
Symbol	recF
ID	4020457
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3622
End bp	4758
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	72%
IMG OID	637960179
Product	recombination protein F
Protein accession	YP_567144
Protein GI	91974485
COG category	[L] Replication, recombination and repair
COG ID	[COG1195] Recombinational DNA repair ATPase (RecF pathway)
TIGRFAM ID	[TIGR00611] recF protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.552608
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCAT CCCGCATCAC CCGGCTGACG CTGACGCACT TCCGCAATTA TCGGGCGGCG 
GCGTTGCATA CGCGTGGCGA ACGGGTGGTG CTGGTGGGCG CGAACGGCGC GGGCAAGACC 
AATTGTCTCG AGGCGATCTC GTTTCTGTCG CCCGGCCGCG GCCTGCGCCG CGCCACGCTC 
GACGACGTCT CCGACCATCA GGGCGACGGC TCCTGGGCGG TGTCGGCCGA GGTCGAGGGC 
GCGCTCGGCC TCGCCACGCT CGGCACCGGG ATCGACCCAC CGCGCGCCGA CGCCGCCACG 
ACGCGGCGCT GCCGGATCGA CCGCGAGCCG GTCGGCTCCG CCACCGCCTT CGGCGATCAT 
CTGCGCATGG TGTGGCTGAC GCCTGCGATG GACGGACTGT TCATGGGCGC GGCGTCGGAA 
CGGCGGCGGT TTTTCGATCG CCTGGTGCTG GCGATCGACA GCCAGCATTC CAGCCGGGTC 
TCGGCGCTCG ACCGCAGCCT GCGCTCGCGC AACCGGCTGC TGGAGGAACG CAACGCGGAC 
CGCCACTGGC TCGACGCGAT CGAGCGCGAA ACCGCCGAAC TCGCCGTCGC GGTCGCGGCG 
ATGCGCGGCC AGACCGCGGC GCGGCTCGCC GCGATGCTCG ACGCCCGCGG CGCGGCGTCG 
GCGTTTCCGT CGGCGAAGAT CATGCTCGAC GGCTGGATGG AAAGCGCGCT GCTGACCGAG 
CCGGCGACCG CGGTCGAGGA TCGCTACCGC GCGATCCTGC GCGATGGCCG CCTGCGCGAC 
GCCGCCGCTG GCCGTACCCT CGACGGCCCG CATCTCACCG ATCTCCAGGT GATCTACGCG 
CCGAAGGCGA TGCCGGCGCG CGACGCCTCC ACCGGCGAGC AGAAGGCGCT GCTGATCGGG 
CTGGTGCTCG CCCATGCGCA GCTCGTCTCC GAGATCACCG GCATCACGCC GCTGCTGCTG 
CTCGACGAGG TGGTGGCGCA TCTCGACCCC GCCCGCCGCC GCGCGTTGTT TGCGGAACTC 
GAGCGGCTTG GCGCGCAGGT CTGGATGACC GGCGCCGATC CGGCGGGCTT CGCCGAGATC 
GGCCCCGACG CCGAGATTTT CACCGTCGAG TCGGGCCGGA TCGCGCCGCA AAAATGA

Protein sequence

MTASRITRLT LTHFRNYRAA ALHTRGERVV LVGANGAGKT NCLEAISFLS PGRGLRRATL 
DDVSDHQGDG SWAVSAEVEG ALGLATLGTG IDPPRADAAT TRRCRIDREP VGSATAFGDH 
LRMVWLTPAM DGLFMGAASE RRRFFDRLVL AIDSQHSSRV SALDRSLRSR NRLLEERNAD 
RHWLDAIERE TAELAVAVAA MRGQTAARLA AMLDARGAAS AFPSAKIMLD GWMESALLTE 
PATAVEDRYR AILRDGRLRD AAAGRTLDGP HLTDLQVIYA PKAMPARDAS TGEQKALLIG 
LVLAHAQLVS EITGITPLLL LDEVVAHLDP ARRRALFAEL ERLGAQVWMT GADPAGFAEI 
GPDAEIFTVE SGRIAPQK