Gene Mext_2954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_2954
Symbol
ID	5833322
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	3299586
End bp	3301286
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	72%
IMG OID	641368754
Product	DNA repair protein RecN
Protein accession	YP_001640414
Protein GI	163852371
COG category	[L] Replication, recombination and repair
COG ID	[COG0497] ATPase involved in DNA repair
TIGRFAM ID	[TIGR00634] DNA repair protein RecN

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.0217727
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGTCC AGCTCGCGAT CCGCGACATC GTTCTGATCG ACAAGCTCGA ATTGACCTTC 
TCCGGGGGGC TCACCGTTCT CACGGGCGAG ACCGGTGCGG GCAAGTCGAT CCTGCTTGAC 
GCGTTCGCCC TGGCGCTCGG GGGGCGCGGC GATGGCGGTC TCGTGCGGCA GGGGGAGGCG 
CAGGGCGGCG TTACCGCCGT GTTCGACGTG GCCCTCGACC ATCCCGCCCG TGCCGTCGCG 
GCGGCGGCCG AGATCGACAC CGATGGTGAC CTGATCCTGC GTCGGACGCA ATTCGCCGAC 
GGGCGCACCC GCGCCTTCGT CAACGACCAG CCGGTCGGCG TGCAGACCAT GCGGGCGATC 
GGCACGGCGC TCGTCGAGAT CCACGGCCAG CACGACGATC GGGCCTTGGC CGACCCCACC 
ACCCACCGCA GCATCCTCGA CGCGTTTGGC GGGCTGCAGG GTCCGCTGGC GCAGGTGGCG 
TCGGCCGCCA AACGCGTGCG CGCCGCCCGC TCGACGCTCG CCGAGCAGCG CGAACGCGTC 
GAGGCTGCGC AGAAGGAAGC CGACTTCCTC CGCCACGCGG TGGAGGAACT GGGCACCCTC 
GATCCGCAGG CCGGCGAGGA GGCGAAGCTC GCCGAGCGCC GCACGCTGAT GCAGCAGGGC 
GAAAAGGTCG CCCGCGAGTT GAACGAGGCG CTCGACCTCG TCGGCGGCTC CGGCTCGCTC 
GTGCCGCACC TGTCCTCCGC CGTGCGCCGC CTGGAGCGGC GCAGCGCCAC GGTGCCGACC 
CTGGTCGATC CGAGCATCGC CGCCCTCGAT GCCGCCCTCG TCGCGCTGGA CGAGGCGCGC 
GCCACCCTCG ATGCCGCGGT GCTCGCCGCC GAGTTCGATC CGCGCGAGCT GGAGCGTGTC 
GAGGAACGGC TATTCGCCCT GCGCGCCGCC TCGCGAAAAT ATTCGGTCCC GGCCGACGAC 
CTCGCCGACC TGCGCAGCCG CTACGATGCG GACGTGGCCG CCCTCGATGC CGGCGAGCAG 
GCGCTTGCCG GGCTCGAAGC CGAACTCACG GCGGCGGAAG CGGCCTATGC CCAGGCCGCC 
AAGCGGCTCG GCGATGGGCG CCGCAAGGCG GCCAAGGCGC TCGATGCGGC AGTGCAGGCC 
GAGTTGCCGC CGCTGAAGCT GGAGGGTGCC CGCTTCATCA CGCAGATCAC CGTGGACGAA 
GCTTCGCGCG ACGCCGCCGG CACCGAGCGG GTCGAGTTCT GGGCGCAGAC CAATCCCGGC 
ACCCGCGCCG GCCCGATGAT GAAGGTCGCC TCCGGTGGCG AGCTGTCCCG CTTCATGCTG 
GCGCTCAAGG TCGTGCTCGC CGGCAAGGGC TCGGCGCCGA CGCTGATTTT CGACGAGATC 
GACACCGGCC TCGGCGGCGC GGTGGCCGAC GCGATCGGCG CACGGCTCGG TCGTCTCTCG 
GAGCAGGTTC AGGTCGTGGC CGTGACCCAC GCGCCGCAGG TCGCTGCCCG CGCGGTGACG 
CATTTCCGCA TCGCCAAGGA CAGCGTGAAG GGGAAAACGG CCAAGGGTGC GGAGAAGAGC 
GCCGAGCGGG TGACGACCCG GGTGGTCGGG CTCGCGGCGG ATGCGCGCCG GGAAGAGATC 
GCTCGGATGC TGGCCGGCGC CACCGTCACC GACGAGGCGC GCGCGGCGGC GGCACGGCTG 
CTCCTGGGAG CCGAAGGCTA G

Protein sequence

MLVQLAIRDI VLIDKLELTF SGGLTVLTGE TGAGKSILLD AFALALGGRG DGGLVRQGEA 
QGGVTAVFDV ALDHPARAVA AAAEIDTDGD LILRRTQFAD GRTRAFVNDQ PVGVQTMRAI 
GTALVEIHGQ HDDRALADPT THRSILDAFG GLQGPLAQVA SAAKRVRAAR STLAEQRERV 
EAAQKEADFL RHAVEELGTL DPQAGEEAKL AERRTLMQQG EKVARELNEA LDLVGGSGSL 
VPHLSSAVRR LERRSATVPT LVDPSIAALD AALVALDEAR ATLDAAVLAA EFDPRELERV 
EERLFALRAA SRKYSVPADD LADLRSRYDA DVAALDAGEQ ALAGLEAELT AAEAAYAQAA 
KRLGDGRRKA AKALDAAVQA ELPPLKLEGA RFITQITVDE ASRDAAGTER VEFWAQTNPG 
TRAGPMMKVA SGGELSRFML ALKVVLAGKG SAPTLIFDEI DTGLGGAVAD AIGARLGRLS 
EQVQVVAVTH APQVAARAVT HFRIAKDSVK GKTAKGAEKS AERVTTRVVG LAADARREEI 
ARMLAGATVT DEARAAAARL LLGAEG