Gene EcHS_A2835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2835
Symbol	recA
ID	5594734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2840125
End bp	2841186
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	54%
IMG OID	640921952
Product	recombinase A
Protein accession	YP_001459463
Protein GI	157162145
COG category	[L] Replication, recombination and repair
COG ID	[COG0468] RecA/RadA recombinase
TIGRFAM ID	[TIGR02012] protein RecA

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.0246819
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTATCG ACGAAAACAA ACAGAAAGCG TTGGCGGCAG CACTGGGCCA GATTGAGAAA 
CAATTTGGTA AAGGCTCCAT CATGCGCCTG GGTGAAGACC GTTCCATGGA TGTGGAAACC 
ATCTCTACCG GTTCGCTTTC ACTGGATATC GCGCTTGGGG CAGGTGGTCT GCCGATGGGC 
CGTATCGTCG AAATCTACGG ACCGGAATCT TCCGGTAAAA CCACGCTGAC GCTGCAGGTG 
ATCGCCGCAG CGCAGCGTGA AGGTAAAACC TGTGCGTTTA TCGATGCTGA ACACGCGCTG 
GACCCAATCT ACGCACGTAA ACTGGGCGTC GATATCGATA ACCTGCTGTG CTCCCAGCCG 
GACACCGGCG AGCAGGCACT GGAAATCTGT GACGCCCTGG CGCGTTCTGG CGCAGTAGAC 
GTTATCGTCG TTGACTCCGT GGCGGCACTG ACGCCGAAAG CGGAAATCGA AGGCGAAATC 
GGCGACTCTC ACATGGGCCT TGCGGCACGT ATGATGAGCC AGGCGATGCG TAAGCTGGCG 
GGTAACCTGA AGCAGTCCAA CACGCTGCTG ATCTTCATCA ACCAGATCCG TATGAAAATT 
GGTGTGATGT TCGGTAACCC GGAAACCACT ACCGGTGGTA ACGCGCTGAA ATTCTACGCC 
TCTGTTCGTC TCGACATCCG TCGTATCGGC GCGGTGAAAG AGGGCGAAAA CGTGGTGGGT 
AGCGAAACCC GCGTGAAAGT GGTGAAGAAC AAAATCGCTG CGCCGTTTAA ACAGGCTGAA 
TTCCAGATCC TCTACGGCGA AGGTATCAAC TTCTACGGCG AACTGGTTGA CCTGGGCGTA 
AAAGAGAAGC TGATCGAGAA AGCAGGCGCG TGGTACAGCT ACAAAGGTGA GAAGATCGGT 
CAGGGTAAAG CGAATGCGAC TGCCTGGCTG AAAGATAACC CGGAAACCGC GAAAGAGATC 
GAGAAGAAAG TACGTGAGTT GCTGCTGAGC AACCCGAACT CAACGCCGGA TTTCTCTGTA 
GATGATAGCG AAGGCGTAGC AGAAACTAAC GAAGATTTTT AA

Protein sequence

MAIDENKQKA LAAALGQIEK QFGKGSIMRL GEDRSMDVET ISTGSLSLDI ALGAGGLPMG 
RIVEIYGPES SGKTTLTLQV IAAAQREGKT CAFIDAEHAL DPIYARKLGV DIDNLLCSQP 
DTGEQALEIC DALARSGAVD VIVVDSVAAL TPKAEIEGEI GDSHMGLAAR MMSQAMRKLA 
GNLKQSNTLL IFINQIRMKI GVMFGNPETT TGGNALKFYA SVRLDIRRIG AVKEGENVVG 
SETRVKVVKN KIAAPFKQAE FQILYGEGIN FYGELVDLGV KEKLIEKAGA WYSYKGEKIG 
QGKANATAWL KDNPETAKEI EKKVRELLLS NPNSTPDFSV DDSEGVAETN EDF