Gene Sare_0004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0004
Symbol	recF
ID	5707577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4766
End bp	5896
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	73%
IMG OID	641269527
Product	recombination protein F
Protein accession	YP_001534931
Protein GI	159035678
COG category	[L] Replication, recombination and repair
COG ID	[COG1195] Recombinational DNA repair ATPase (RecF pathway)
TIGRFAM ID	[TIGR00611] recF protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.366352
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000175389
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

GTGTACGTAC GCCGGCTCGA ACTCGTCGAT TTCCGCTCGT ACGAGCGGGT CGGCGTGGAC 
CTCGAACCGG GGGCGAACGT CCTGGTCGGC CACAACGGGG TCGGCAAGAC CAACCTGATC 
GAGGCGCTCG GCTACGTGGC GACCCTGGAC TCCCACCGGG TCGCCACCGA CGCCCCGCTG 
GTCCGGATGG GCGCCGGTGC GGCGGTCATC CGCTGCGCGG TGGTGCACGA GGGCCGCGAG 
TTGCTGATCG AGTTGGAGAT TGTCCCGGGG CGGGCCAACC GGGCCCGGCT CGGTCGGTCC 
CCGGCCCGGC GAGCCCGGGA CGTGCTCGGT GCCCTGCGGC TGGTGCTCTT CGCCCCGGAG 
GACCTGGAAC TGGTCCGGGG CGACCCGGCC GAGCGCCGCC GCTACCTTGA CGACCTGCTG 
GTGCTCCGAC AGCCTCGCTA CGCCGGTGTG CGGGCCGACT ACGAACGGGT GGTCCGGCAG 
CGCAACGCCC TGCTGCGCAC CGCGTACCTG GCCAGGAAGA CCGGCGGCAC CCGCGGTGGG 
GACCTGTCCA CGCTCGCGGT GTGGGACGAC CACCTCGCGC GGCACGGCGC GGAACTGCTC 
GCCGGTCGAC TCGACCTCGT TGCCGCGCTC GCCCCTCATG TGACCAGGGC ATACGACGCG 
GTGGCCGCCG GCACGGGCGC CGCCGGAATC GCGTATCGAC CCTCGGTTGA GCTGCCCACC 
CCGACCACCG ACCGGGCTGA CCTGACCGCG GCGTTGAGCG CCGCGCTCGC CGCCGGCCGG 
TCCGCTGAGA TCGAGCGGGG AACCACCCTG GTCGGCCCGC ACCGGGACGA CCTCACCCTG 
ACGCTGGGGC CACTGCCCGC GAAGGGGTAC GCCAGCCACG GCGAGTCCTG GTCCTTGGCG 
CTGGCACTCC GGCTGGCCGG ATACGACCTG CTGCGGGTCG ACGGAATCGA ACCGGTGCTG 
GTGCTGGATG ACGTCTTCGC CGAGTTGGAC ACGGGCCGTC GGGATCGGCT CGCGCAACTG 
GTCGGCGACG CGAGTCAACT CCTGGTGACG TGCGCGGTGG AGGAGGATGT TCCCGCGCGT 
CTGCGGGGTG CGCGGTTCGT TGTCCGCGGT GGGGAGGTGC ACCGTGCCTG A

Protein sequence

MYVRRLELVD FRSYERVGVD LEPGANVLVG HNGVGKTNLI EALGYVATLD SHRVATDAPL 
VRMGAGAAVI RCAVVHEGRE LLIELEIVPG RANRARLGRS PARRARDVLG ALRLVLFAPE 
DLELVRGDPA ERRRYLDDLL VLRQPRYAGV RADYERVVRQ RNALLRTAYL ARKTGGTRGG 
DLSTLAVWDD HLARHGAELL AGRLDLVAAL APHVTRAYDA VAAGTGAAGI AYRPSVELPT 
PTTDRADLTA ALSAALAAGR SAEIERGTTL VGPHRDDLTL TLGPLPAKGY ASHGESWSLA 
LALRLAGYDL LRVDGIEPVL VLDDVFAELD TGRRDRLAQL VGDASQLLVT CAVEEDVPAR 
LRGARFVVRG GEVHRA