Gene EcSMS35_4938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4938
Symbol	radA
ID	6145908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	5052799
End bp	5054181
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	58%
IMG OID	641619741
Product	DNA repair protein RadA
Protein accession	YP_001746845
Protein GI	170681066
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1066] Predicted ATP-dependent serine protease
TIGRFAM ID	[TIGR00416] DNA repair protein RadA

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.664332
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAAAAG CTCCAAAACG CGCCTTTGTT TGTAATGAAT GCGGGGCCGA TTATCCGCGC 
TGGCAGGGGC AGTGCAGTGC CTGTCATGCC TGGAACACCA TCACCGAGGT GCGTCTTGCT 
GCGTCGCCAA CGGTGGCGCG TAACGAGCGT CTCAGTGGCT ATGCCGGTAG CGCCGGAGTG 
GCAAAAGTCC AGAAACTCTC CGACATCAGC CTTGAGGAGC TGCCGCGTTT TTCTACCGGA 
TTTAAAGAGT TCGACCGCGT ATTAGGCGGC GGGGTGGTGC CGGGAAGCGC CATTCTGATT 
GGCGGTAACC CAGGTGCGGG GAAATCCACG CTGCTGTTGC AAACGCTGTG CAAACTGGCC 
CAGCAGATGA AAACGCTGTA TGTCACCGGC GAAGAGTCGC TGCAACAGGT GGCAATGCGC 
GCTCATCGCC TTGGCCTGCC GACTGACAAT CTCAATATGT TGTCGGAAAC CAGCATCGAG 
CAGATCTGCC TGATTGCCGA AGAAGAGCAA CCGAAGCTGA TGGTAATTGA CTCCATCCAG 
GTGATGCATA TGGCGGATGT ACAATCATCG CCTGGCAGCG TGGCGCAGGT GCGTGAAACG 
GCGGCTTATC TGACGCGCTT CGCCAAAACG CGCGGTGTGG CGATTGTCAT GGTTGGGCAC 
GTAACCAAAG ATGGCTCGCT GGCTGGCCCT AAAGTGCTGG AACACTGTAT CGACTGTTCG 
GTGCTTCTGG ATGGCGATGC CGACTCCCGT TTTCGCACCT TACGCAGCCA TAAAAACCGC 
TTCGGCGCGG TGAATGAGCT GGGCGTCTTC GCAATGACCG AACAGGGTCT GCGTGAAGTC 
AGCAACCCTT CGGCAATCTT TTTAAGCCGC GGTGATGAAG TGACCTCGGG TAGCTCAGTG 
ATGGTAGTGT GGGAAGGAAC GCGTCCGCTG CTGGTGGAGA TTCAGGCGCT CGTCGATCAC 
TCGATGATGG CGAATCCACG CCGCGTGGCA GTCGGGCTGG AGCAAAACCG TCTGGCAATC 
CTGCTGGCGG TGCTTCACCG TCACGGTGGT CTACAAATGG CCGATCAGGA TGTGTTTGTT 
AACGTGGTCG GTGGCGTGAA GGTGACGGAA ACCAGCGCCG ACTTAGCGTT ACTGCTGGCG 
ATGGTTTCCA GCCTGCGCGA CAGACCGCTG CCGCAGGATC TGGTGGTGTT TGGTGAAGTC 
GGGCTGGCAG GGGAGATCCG CCCGGTGCCC AGCGGTCAGG AACGTATCTC AGAAGCGGCG 
AAACATGGTT TTCGGCGGGC GATTGTTCCG GCGGCTAACG TGCCGAAAAA AGCGCCGGAA 
GGGATGCAGA TTTTTGGCGT TAAAAAACTC TCCGACGCGC TTAGCGTGTT CGACGACTTA 
TAA

Protein sequence

MAKAPKRAFV CNECGADYPR WQGQCSACHA WNTITEVRLA ASPTVARNER LSGYAGSAGV 
AKVQKLSDIS LEELPRFSTG FKEFDRVLGG GVVPGSAILI GGNPGAGKST LLLQTLCKLA 
QQMKTLYVTG EESLQQVAMR AHRLGLPTDN LNMLSETSIE QICLIAEEEQ PKLMVIDSIQ 
VMHMADVQSS PGSVAQVRET AAYLTRFAKT RGVAIVMVGH VTKDGSLAGP KVLEHCIDCS 
VLLDGDADSR FRTLRSHKNR FGAVNELGVF AMTEQGLREV SNPSAIFLSR GDEVTSGSSV 
MVVWEGTRPL LVEIQALVDH SMMANPRRVA VGLEQNRLAI LLAVLHRHGG LQMADQDVFV 
NVVGGVKVTE TSADLALLLA MVSSLRDRPL PQDLVVFGEV GLAGEIRPVP SGQERISEAA 
KHGFRRAIVP AANVPKKAPE GMQIFGVKKL SDALSVFDDL