Gene Sare_1389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1389
Symbol	recA
ID	5703748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1604341
End bp	1605387
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	68%
IMG OID	641270899
Product	recombinase A
Protein accession	YP_001536280
Protein GI	159037027
COG category	[L] Replication, recombination and repair
COG ID	[COG0468] RecA/RadA recombinase
TIGRFAM ID	[TIGR02012] protein RecA

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.384565
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0556082
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGCAG TGCCTGATCG GGAGAGGGCA CTCGACCTTG CTCTCGCTCA GATCGACAAA 
CAGTTCGGCA AGGGCTCGGT GATGCGGCTG GGGGAGCGCC CGGTCGTGCA GACCGCGGTG 
GTCCCGACCG GGTCCATCGC GCTGGATGTG GCCCTCGGGG TGGGCGGCCT GCCCCGGGGT 
CGGGTCATCG AGGTCTACGG CCCGGAGAGC AGCGGTAAGA CGACGGTGGC GCTGCACGCG 
GTGGCCAACG CCCAGCGTGC CGGCGGTATC GCCGCCTTCG TCGACGCCGA ACACGCGCTC 
GACCCGGAAT ACGCGAGGGC CCTCGGCGTT GACACCGACG CGCTGCTGGT CTCCCAACCT 
GACACCGGTG AGCAGGCCCT GGAGATCGCG GACATGCTGG TCCGCTCCGG CGCGCTCGAC 
ATCATCATCA TCGACTCGGT GGCCGCGTTG GTGCCCCGCG CCGAGATCGA GGGGGAGATG 
GGCGACAGCC ACGTGGGTCT CCAGGCCCGG CTGATGAGCC AGGCCCTGCG CAAGATGACC 
GGTGTGCTCA GCAACACCGG CACGACGGCG ATCTTCATCA ACCAGCTCCG CGAGAAGATC 
GGCGTCATGT TCGGCAGCCC TGAGACCACC ACCGGTGGGC GGGCACTGAA GTTCTACGCC 
TCGGTCCGGC TCGATGTGCG TCGCATCGAG AGCCTCAAGG ACGGCACCGA CGTGGTCGGT 
AACCGCACCC GGGTCAAGGT CGTGAAGAAC AAGGTGGCCG CGCCGTTCAA GCAGGCCGAG 
TTCGACATCA TGTACGGCAA GGGCATCTCC CGCGAGGGGT CGCTGATCGA CGTTGGCGTC 
GAGCAGGCGA TCATCCGGAA GTCCGGCGCG TGGTACACCT ACGAGGGCGA CCAGCTCGGC 
CAGGGCAAGG AGAAGGCCCG CGAGTTCCTT CGGGAGAACC CGGACGTGGC CGCCGAGATC 
GAGAAGAAGA TCCTGGAGAA GCTCGGCGTC GGCGCCGGCG CGGGTGACGC CACCGGCGGT 
CCGGAGTTGC CGCCGGTCGA CTTCTGA

Protein sequence

MAAVPDRERA LDLALAQIDK QFGKGSVMRL GERPVVQTAV VPTGSIALDV ALGVGGLPRG 
RVIEVYGPES SGKTTVALHA VANAQRAGGI AAFVDAEHAL DPEYARALGV DTDALLVSQP 
DTGEQALEIA DMLVRSGALD IIIIDSVAAL VPRAEIEGEM GDSHVGLQAR LMSQALRKMT 
GVLSNTGTTA IFINQLREKI GVMFGSPETT TGGRALKFYA SVRLDVRRIE SLKDGTDVVG 
NRTRVKVVKN KVAAPFKQAE FDIMYGKGIS REGSLIDVGV EQAIIRKSGA WYTYEGDQLG 
QGKEKAREFL RENPDVAAEI EKKILEKLGV GAGAGDATGG PELPPVDF