Gene RPB_0004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0004
Symbol	recF
ID	3910209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4098
End bp	5234
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	72%
IMG OID	637881885
Product	recombination protein F
Protein accession	YP_483627
Protein GI	86747131
COG category	[L] Replication, recombination and repair
COG ID	[COG1195] Recombinational DNA repair ATPase (RecF pathway)
TIGRFAM ID	[TIGR00611] recF protein

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.949729
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCCT CCCGCATCAC CCGGCTGACG TTGACGCATT TCCGCAATTA TCGGGCGGCG 
GTGCTGACGA CGAGTGCCGA GCGCGTGGTG CTGGTCGGCG CCAACGGCGC CGGCAAGACC 
AATTGCCTCG AGGCGATCTC GTTTCTGTCG CCGGGGCGGG GGTTGCGGCG GGCGACGCTG 
GACGACGTCG CCGACAATGA GGGCGACGGC TCCTGGGCGG TGGCGGCGGA GGTCGAGGGC 
GCGCTCGGGC TGGCGACGCT CGGCACCGGG ATCGATCCGC CGCGCGCCGA CGCCGCGACC 
TCGCGGCGCT GCCGGATCGA CCGCGAGCCG GTCGGCTCCG CCACCGCATT CGGCGATCAC 
TTACGCATGG TGTGGCTGAC GCCGGCGATG GACGGGCTGT TCATGGGCGC GGCCTCGGAA 
CGGCGGCGGT TCTTCGACCG GCTGGTGCTG GCGATCGACA GCCAGCATTC GGGCCGGGTC 
TCGGCGCTGG ACCGCAGCCT CAGATCGCGG AACCGCCTGC TGGAGGTACG TTACCCCGAC 
GCGCATTGGC TCGATGCGAT CGAGCGCGAA ACCGCCGAGC TCGCGGTCGC GGTCGCGGCG 
ATGCGCGGCC AGACCGCGAT GCGCCTCGCC GCGATGCTCG ACGCCCGCGG CGCGGCATCG 
GCGTTTCCGT CGGCGAAGAT CATGCTCGAC GGCTGGATGG AGAGCGCGCT GCTCACCGAA 
CCCGCCACGG CGGTGGAAGA TCGCTACCGC ACCATCCTGC GCGAGGGCCG CCCGCGCGAC 
GCCGCCGCCG GCCGCACCCT CGACGGCCCG CATCTGACCG ACCTCGAAGT CGTCTACGCG 
CCGAAGGCGA TGCCGGCGCG CGACGCCTCC ACCGGCGAAC AGAAGGCGCT GCTGATCGGG 
CTCGTCCTCG CGCATGCGCA GCTCGTCTCG GAGATGACCG GCATCACGCC GCTGCTGCTG 
CTCGACGAGG TGGTGGCGCA TCTCGACCCG TCGCGGCGCG CCGCGCTGTT CGAGGAATTG 
GCGAAGCTCG GCGCCCAGGT CTGGATGACC GGCGCCGACC CCGCAGCGTT CGCCGAGATC 
GGTTCCGGCG CCGAGATATT CACCGTCGAA TCCGGCCGGA TCAGGCCGCA ACAATGA

Protein sequence

MTASRITRLT LTHFRNYRAA VLTTSAERVV LVGANGAGKT NCLEAISFLS PGRGLRRATL 
DDVADNEGDG SWAVAAEVEG ALGLATLGTG IDPPRADAAT SRRCRIDREP VGSATAFGDH 
LRMVWLTPAM DGLFMGAASE RRRFFDRLVL AIDSQHSGRV SALDRSLRSR NRLLEVRYPD 
AHWLDAIERE TAELAVAVAA MRGQTAMRLA AMLDARGAAS AFPSAKIMLD GWMESALLTE 
PATAVEDRYR TILREGRPRD AAAGRTLDGP HLTDLEVVYA PKAMPARDAS TGEQKALLIG 
LVLAHAQLVS EMTGITPLLL LDEVVAHLDP SRRAALFEEL AKLGAQVWMT GADPAAFAEI 
GSGAEIFTVE SGRIRPQQ