Gene SNSL254_A3031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3031
Symbol	recA
ID	6484821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	2951353
End bp	2952414
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	54%
IMG OID	642738346
Product	recombinase A
Protein accession	YP_002042070
Protein GI	194446772
COG category	[L] Replication, recombination and repair
COG ID	[COG0468] RecA/RadA recombinase
TIGRFAM ID	[TIGR02012] protein RecA

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00473022
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.000967818
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTATCG ACGAAAACAA ACAGAAAGCG TTGGCGGCAG CACTGGGCCA AATTGAAAAG 
CAATTTGGTA AAGGCTCCAT CATGCGTCTG GGTGAAGACC GTTCTATGGA TGTGGAAACT 
ATCTCCACCG GTTCGCTTTC ACTGGACATC GCACTCGGTG CGGGCGGTCT GCCGATGGGG 
CGTATCGTCG AAATTTACGG GCCGGAATCT TCCGGTAAAA CGACCCTGAC GCTGCAGGTG 
ATTGCCGCTG CGCAGCGTGA AGGTAAAACC TGTGCGTTTA TCGATGCGGA ACACGCGCTT 
GACCCTGTTT ACGCACGCAA GCTGGGCGTC GATATCGATA ACCTGCTCTG TTCTCAGCCG 
GATACCGGCG AGCAGGCGCT GGAAATCTGT GACGCGCTGG CGCGTTCAGG CGCGGTGGAC 
GTCATTGTGG TCGACTCCGT AGCGGCGCTA ACGCCGAAAG CGGAAATCGA AGGCGAAATC 
GGCGACTCTC ACATGGGCCT CGCGGCGCGT ATGATGAGCC AGGCGATGCG TAAGCTGGCG 
GGGAACCTGA AACAGTCCAA TACGCTGCTG ATCTTCATCA ACCAGATCCG TATGAAAATT 
GGCGTGATGT TTGGTAACCC GGAAACCACC ACCGGCGGTA ACGCGCTGAA ATTCTACGCC 
TCCGTTCGTC TTGATATCCG TCGTATTGGC GCGGTGAAAG AAGGCGATAA TGTCGTGGGT 
AGCGAAACGC GTGTGAAAGT GGTGAAAAAC AAAATCGCCG CGCCGTTTAA GCAGGCCGAG 
TTCCAGATCC TCTACGGCGA AGGCATCAAC TTCTATGGCG AACTGGTTGA CCTGGGCGTG 
AAAGAGAAGC TGATCGAGAA AGCGGGCGCA TGGTACAGCT ACAACGGCGA GAAGATTGGC 
CAGGGTAAAG CGAACGCGAC TACCTGGCTG AAAGAGAACC CGGCAACAGC GAAAGAGATT 
GAGAAAAGAG TGCGTGAATT ACTGTTGAGT AATCAGAATG CCACGCCCGA TTTCGCCGTT 
GACGATAGCG AAGGCGTTGC AGAAACCAAC GAAGATTTTT AA

Protein sequence

MAIDENKQKA LAAALGQIEK QFGKGSIMRL GEDRSMDVET ISTGSLSLDI ALGAGGLPMG 
RIVEIYGPES SGKTTLTLQV IAAAQREGKT CAFIDAEHAL DPVYARKLGV DIDNLLCSQP 
DTGEQALEIC DALARSGAVD VIVVDSVAAL TPKAEIEGEI GDSHMGLAAR MMSQAMRKLA 
GNLKQSNTLL IFINQIRMKI GVMFGNPETT TGGNALKFYA SVRLDIRRIG AVKEGDNVVG 
SETRVKVVKN KIAAPFKQAE FQILYGEGIN FYGELVDLGV KEKLIEKAGA WYSYNGEKIG 
QGKANATTWL KENPATAKEI EKRVRELLLS NQNATPDFAV DDSEGVAETN EDF