Gene Smed_2071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2071
Symbol
ID	5322930
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2124395
End bp	2126068
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	64%
IMG OID	640791008
Product	DNA repair protein RecN
Protein accession	YP_001327739
Protein GI	150397272
COG category	[L] Replication, recombination and repair
COG ID	[COG0497] ATPase involved in DNA repair
TIGRFAM ID	[TIGR00634] DNA repair protein RecN

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.240609
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00158855
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTCGCCC AGCTCGCGAT CCGAGATATC GTCCTGATCG AACGGCTTGA CCTCAGCTTC 
GATGTCGGGC TGTCGGTGCT GACCGGCGAA ACCGGTGCGG GCAAATCCAT TCTCCTCGAC 
AGTCTGTCGC TTGCGCTGGG CGGGCGCGGC GACGGTTCGC TCGTGCGCCA TGGCGAGGAC 
AGGGGCCAGG TGAGCGCCGT GTTCGATGTC CCGGCCGGTC ATTCGGCGCG GCTCCTTTTG 
CGGGAAAACG GCATTGATGA CGATGGCGAT CTGATCTTCC GTCGCGTGCA GTCGGCGGAC 
GGCCGCACCA AGGCCTTTAT CAACGATCAG CCGGTCAGCG TGCAGCTGAT GCGCCAGGTC 
GGCCAGACGC TTGTTGAAAT CCATGGCCAG CATGACGATC GAGCGCTCGT CGATACCGAC 
GCGCACCGCA CGCTCGTCGA TGCTTTTGGC GGCACCACCG ATGCGGCGGA AGCGGTCGCG 
AACCTTTACC GCGCCTGGAA GGATGCCGAG CGGGGGCTGA AGAAACATCG GGAGAAGGTG 
GAGGCCGCAT CCCGGGAGGC GGACTATCTC CGCTCCTCCG TCGAGGAGCT CGAGACACTA 
TCGCCGCGCG ATGGCGAAGA GGAGGAGCTG GCGGAGAGCC GCGCCCGCAT GATGAAGGTC 
GAACGCATCG CCGGCGATAT CAGCGAGGCA GCCGAGTTTC TGAACGGCAA TGCATCGCCT 
GTTCCGCTCA TCGCATCGCT CGTCCGGCGG CTGGAGCGCA AGAGCCATGA GGCTCCCGGC 
CTCCTTGAAG AGACCGTCGA ACTTCTGGAC GGTGCACTGA ACCAGCTTGC GGATGCCCAG 
ATGGCGGTCG AGCGCGCGTT GCGCAACACC GAGTTCGATC CCAAGGAGCT CGAACGCGTC 
GAAGAGCGGC TTTTCGCATT GCGCGCAGCG GGCCGGAAAT ACTCCGTCCC CGTCACCGAA 
TTGCCCGCCC TTGCCGTGCG GATGATCGCC GATCTCGCCG ATCTCGATGC AGGCGAGGAG 
AAGCTGCAGC AACTCGAGGT ACGGGTCGGC GAATGCAAAG CGGCGTTTGA CGCTGCATCG 
CAGTCGCTGT CGGAAAAGCG GCACAATACG GCCGTTGCAC TTTCGGCGGC CGTTATGGAA 
GAACTGCCGG CGCTGAAGCT GGAACGCGCC CGCTTCATGG TGGAGGTGAC GAGCGATCCG 
GAATCGCCTA CGGCCGACGG GATCGACTCA GTCGAGTTCC ACGTACAGAC CAATCCCGGC 
ACCAGGCCGG GACCGATCAT GAAGGTGGCT TCGGGCGGCG AGCTTTCGCG GTTCCTGCTC 
GCGCTGAAAG TGGCGCTTGC CGACCGGGGT TCGGCGCCGA CTCTCGTCTT CGACGAGATC 
GACACGGGTG TTGGTGGTGC CGTGGCAGAT GCGATCGGTC AGCGCCTGAA ACGCCTTTCG 
AAGACCGTCC AGGTGCTTTC GGTCACCCAT GCGCCGCAGG TTGCCGCGCG TGCGGCCACG 
CATCTCCTGA TCTCGAAGGG TCCCTCGGCG GAAAAAGCCG AGATGATCGC GACTCGCGTC 
GCTCGCATGG ACGATGCGGC ACGCACCGAA GAGATAGCCC GTATGCTGGC AGGGGCCTCG 
ATCACCGAAG AGGCGAGGGC CGCGGCTGCG CGATTGCTCG CCGGCAATGC CTGA

Protein sequence

MLAQLAIRDI VLIERLDLSF DVGLSVLTGE TGAGKSILLD SLSLALGGRG DGSLVRHGED 
RGQVSAVFDV PAGHSARLLL RENGIDDDGD LIFRRVQSAD GRTKAFINDQ PVSVQLMRQV 
GQTLVEIHGQ HDDRALVDTD AHRTLVDAFG GTTDAAEAVA NLYRAWKDAE RGLKKHREKV 
EAASREADYL RSSVEELETL SPRDGEEEEL AESRARMMKV ERIAGDISEA AEFLNGNASP 
VPLIASLVRR LERKSHEAPG LLEETVELLD GALNQLADAQ MAVERALRNT EFDPKELERV 
EERLFALRAA GRKYSVPVTE LPALAVRMIA DLADLDAGEE KLQQLEVRVG ECKAAFDAAS 
QSLSEKRHNT AVALSAAVME ELPALKLERA RFMVEVTSDP ESPTADGIDS VEFHVQTNPG 
TRPGPIMKVA SGGELSRFLL ALKVALADRG SAPTLVFDEI DTGVGGAVAD AIGQRLKRLS 
KTVQVLSVTH APQVAARAAT HLLISKGPSA EKAEMIATRV ARMDDAARTE EIARMLAGAS 
ITEEARAAAA RLLAGNA