Gene Ndas_0666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0666
Symbol
ID	9244508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	817659
End bp	818795
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	70%
IMG OID
Product	recA protein
Protein accession	YP_003678617
Protein GI	297559643
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.386455
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.202905
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCATCTG GAGACCGAGA CAAGGCTCTC GAAACAGCGC TCGCCCAGAT CGAGCGGCAG 
TTCGGCAAGG GCTCCATCAT GCGCCTGGGC GACGACGACC GGCCGCCGGT GGAGTCGATC 
CCCACCGGGG CGATCGCGCT CGACGTGGCG CTCGGCATCG GAGGCCTGCC CCGGGGCCGC 
GTCGTGGAGA TCTACGGCCC CGAGTCCAGC GGTAAGACCA CCGTCGCCCT GCACGCGGTG 
GCCAGCGCCC AGCGGATGGG CGGCATCGCG GCCTTCGTCG ACGCCGAGCA CGCGCTCGAC 
CCCGAGTACG CCAAGAAGAT CGGCGTCAAC ACCGACGACC TGCTGCTCTC GCAGCCGGAC 
ACCGGTGAGC AGGCGCTGGA GATCGTCGAC ATGCTCATCC GCTCCGGAGC GGTCTCCATC 
ATCGTCATCG ACTCCGTGGC GGCCCTGGTG CCCCGCGCCG AGATCGAGGG CGAGATGGGC 
GACAGCCACG TCGGACTCCA GGCCCGCCTG ATGTCCCAGG CGCTGCGCAA GATCGCCGGT 
GCGCTCCACC AGACCAACAC CACCGCGATC TTCATCAACC AGCTGCGCGA GAAGGTCGGC 
GTCATGTTCG GCTCGCCCGA GACGACGACC GGCGGCAAGG CGCTCAAGTT CTACGCCTCG 
GTGCGCCTGG ACGTGCGCCG CATCGAGACG CTCAAGGACG GCACCGACGC GGTCGGCAAC 
CGCACCCGCG TCAAGGTCGT CAAGAACAAG GTCGCGCCGC CCTTCAAGCA GGCCGAGTTC 
GACATCCTCT ACGGGGTGGG CGTCTCGCGC GAGGGCAGCC TCATCGACCT GGGCGTGGAG 
CACGGCATCG TCCGCAAGTC GGGCGCCTGG TACACCTACG AGGGCACCCA GCTGGGCCAG 
GGCAAGGAGA ACGCGCGCAA CTTCCTGCGC GAGAACGCCG ACATGGCCAA CGAGGTCGAG 
AAGAAGATCA AGGAGAAGCT GGGCGTGCCC GTCAAGGGCG ACGACAGCGC CTCCGGCCCG 
GCCGCCGAAC CGGCCAAGGC CGCCGCTGAG GCGGCTGCGG ACCCGGCCGC CGCGGCCAAG 
GCACCCGCCA AGCGCGCCGC GGCCAGGACC CCCAAGGCGC CCGCGGCTGA TGCGTGA

Protein sequence

MASGDRDKAL ETALAQIERQ FGKGSIMRLG DDDRPPVESI PTGAIALDVA LGIGGLPRGR 
VVEIYGPESS GKTTVALHAV ASAQRMGGIA AFVDAEHALD PEYAKKIGVN TDDLLLSQPD 
TGEQALEIVD MLIRSGAVSI IVIDSVAALV PRAEIEGEMG DSHVGLQARL MSQALRKIAG 
ALHQTNTTAI FINQLREKVG VMFGSPETTT GGKALKFYAS VRLDVRRIET LKDGTDAVGN 
RTRVKVVKNK VAPPFKQAEF DILYGVGVSR EGSLIDLGVE HGIVRKSGAW YTYEGTQLGQ 
GKENARNFLR ENADMANEVE KKIKEKLGVP VKGDDSASGP AAEPAKAAAE AAADPAAAAK 
APAKRAAART PKAPAADA