Gene Namu_4072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4072
Symbol
ID	8449692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4487633
End bp	4489399
Gene Length	1767 bp
Protein Length	588 aa
Translation table	11
GC content	75%
IMG OID	645043116
Product	DNA repair protein RecN
Protein accession	YP_003203351
Protein GI	258654195
COG category	[L] Replication, recombination and repair
COG ID	[COG0497] ATPase involved in DNA repair
TIGRFAM ID	[TIGR00634] DNA repair protein RecN

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0367674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.136098
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCAAG AGCTGCGGAT TGCCGACCTC GGGGTGATCG ACGAGGCGTT GATCGAGCCC 
GATCGTGGCT TCACCGTCGT GACCGGTGAG ACGGGTGCGG GCAAGACGAT GGTGGTCACC 
GCGCTCGGCC TGATCGGCGG GCGCCGGGGT GACGCCAGCA AGGTCCGGGC CGGGGCCGAG 
CGGGCCACCG TCGAGGTCCG CTGGTCGCCG CCCGACGGCG AGAGCGAGTC TCCCGCCCAG 
GAACTGGTGT CCTCGGTCGG CGGCCGCTTC GACGAGGACG GCACGCTGAT CGCCGCCCGT 
TCCGTGGGCA CCGACGGCCG ATCCCGCGCG CACGTCGGCG GCCGGTCCGT GCCGCTGGCC 
ACGCTGGCCG AGCTGGCCGA GCCGCTCATC GCCGTGCACG GCCAGTCCGA GGCCATCTCG 
TTGCTGCGAC CGGGCCCGCA GCGGGCCGTC CTGGACCGCT TCGCCGGGCT CACCGCGCAG 
GTCGGTCGGT ATCGCGAGCT ACGCAGCCGC TGGCACCGGA TGGCCGCCGA TCTGGCCGAC 
CGGCGGGCCC GGGCCCGGGA GCGGGCCCAG CGCGAGCAGC TGTTGCGCAT CGGCCTGGCC 
GAGATCGAGG CGGCCGCGCC GGTGCCCGGC GAGGATCGGG ACCTGGTCGA GGAGGTGCGC 
CGGCTGCAGA ACCTGGACGG GCTGCGGGCG GCGGCGGCGG GTGCTCACGA GTCGCTGACC 
GGGTCGGAGG ACGCGGCCGC CGCACCGGCC GCGCTGGCCC TGGTGCACGG CGCCCAGCAT 
CTGCTGGACA CGGCGGAGGA TCCGCGGTTG GCCGAACTGG GTGGTCAGCT GCAGCAGGCC 
GCGCTGGTCC TGGCCGATGT CGGATCCGAG CTGTCAGTCT TCCTCTCCGG GCTGGACGAC 
GAGCCGGGCC GGCTGACCCA GGTGCTCGAG CGGCAGGCGA CCCTGCGGGC GCTGACCCGC 
CGCTACGGCG ACGACGTCGA CGCCGTCTGC GCCTGGGCTC GGTCGGCCGG CCAGGAGCTG 
CTCGAGCTGG ATTCCTCCGA CGACCGGCTG GCCCGGATGC AGGCCGACCT CGACGAGGTG 
CGCGGCGAGT TGGGCCGGTT GGCCGCGCGG CTGTCCGGCG AGCGGTCCGC GGCGGCCGAG 
CGGCTGGGTC GCCTGGTCAC GGCCGAGCTG GCCTCCCTGG CCATGGCCCG GGCCACCGTC 
CGGGTGCGGG TCAGCCAGCA GGCGGCCGAC CCGCACGACC CGCAGGCGGT GCCGGTCGAC 
CACAGCTGGC TGCTGGCCGG CCCAGACGGG GTGGACCAGG TGGAGATCGT CATGGTCGCG 
CACGCCGGTG CCCCCGAACT GCCGATCGCC AAGGGCGCCT CGGGTGGCGA GCTGTCCCGG 
GTGATGCTGG CCCTGGAGGT GGTGCTGGCC GACTCCGATC CGGTCTCGAC CATGGTCTTC 
GACGAGGTCG ACGCCGGGGT CGGCGGCCGG GCCGCGACCG AGATCGGGGA GCGGCTGGCC 
GCGCTGGCCC GGACCCACCA GGTCATCGTC GTGACCCACC TGGCTCAGGT GGCCGCCCAC 
GCCGATCGTC ACTACATCGT CGACGCCGAC TCCTCCGGCC GGATCGGCAC CTCGAACGTG 
CGGCTGGTCA CCGGACGCGA ACGCGAACGG GAGCTGGCCC GGATGCTGGG CGGGACGAAC 
GGCCCCGCCG CCCGGGCGCA CGCCCGGGAC CTGCTCGCCG CGGCCAAGGG TGCGACCGGC 
ACCACCCCCT TGCGCCGGGC GGGCTGA

Protein sequence

MLQELRIADL GVIDEALIEP DRGFTVVTGE TGAGKTMVVT ALGLIGGRRG DASKVRAGAE 
RATVEVRWSP PDGESESPAQ ELVSSVGGRF DEDGTLIAAR SVGTDGRSRA HVGGRSVPLA 
TLAELAEPLI AVHGQSEAIS LLRPGPQRAV LDRFAGLTAQ VGRYRELRSR WHRMAADLAD 
RRARARERAQ REQLLRIGLA EIEAAAPVPG EDRDLVEEVR RLQNLDGLRA AAAGAHESLT 
GSEDAAAAPA ALALVHGAQH LLDTAEDPRL AELGGQLQQA ALVLADVGSE LSVFLSGLDD 
EPGRLTQVLE RQATLRALTR RYGDDVDAVC AWARSAGQEL LELDSSDDRL ARMQADLDEV 
RGELGRLAAR LSGERSAAAE RLGRLVTAEL ASLAMARATV RVRVSQQAAD PHDPQAVPVD 
HSWLLAGPDG VDQVEIVMVA HAGAPELPIA KGASGGELSR VMLALEVVLA DSDPVSTMVF 
DEVDAGVGGR AATEIGERLA ALARTHQVIV VTHLAQVAAH ADRHYIVDAD SSGRIGTSNV 
RLVTGRERER ELARMLGGTN GPAARAHARD LLAAAKGATG TTPLRRAG