Gene Ndas_3088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3088
Symbol
ID	9246944
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3695888
End bp	3697258
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	74%
IMG OID
Product	AAA ATPase central domain protein
Protein accession	YP_003681003
Protein GI	297562029
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCTCGG CCGCCTACCC TGGACAGGTG TCCGACACGC TCTTCGACGA CGCCGGCGCG 
GAGGCCGCCA GAGGCCAGGA ACCGCTCGCC GTGCGCATGC GCCCCCGCAC CCTCGACGAG 
GTCGTGGGCC AGCGCCACCT GCTCGGCGAG GGCAGCCCGC TGCGCCGCCT GGTCGAGGAC 
GACGCGCCCA TGTCCGTGTT CCTGTGGGGC CCGCCCGGCA CCGGCAAGAC CACCCTGGCC 
ACCGTGGTCA GCCGCGTCAC CAAGCGCCGC TTCGTCGAGC TGTCCGCCGT CAACGCCGGG 
GTCAAGGACG TGCGCGCCGT CATCGACGAC GCCCGGCGCC GCATGGGCAT GCACGGCACC 
CGCACCCTGC TCTTCGTGGA CGAGGTCCAC CGCTTCAACA AGACCCAGCA GGACGCGCTG 
CTGCCCGCCG TGGAGAACCG CTGGGTCAGC TTCATCGGCG CCACCACCGA GAACCCCTTC 
TTCTCCGTGG TCAGCCCCCT GCTGTCGCGT TCGCTGCTGC TGTCCCTGGA GTCGCTGGAG 
GACGCCGACG TCCGCGCCCT GGTGGACCGG GCGCTGGCCG ACGAGCGCGG GCTGGACGGG 
CGCTACACGC TCTCCGACGA GGGCGCTGAC CACCTCGTAC GCCTCGCGGG CGGCGACGGC 
CGCCGCTCCC TGACCTACCT GGAGGCCGCC GCGCTCGTCG CCGGCGCCCC CGGCGCGGAG 
CCGGTCACCA TCACGGCCGA ACACGTCGAA CGCGCCGTGG ACCGGCACGC CGTGCGCTAC 
GACCGCTCCG GCGACCAGCA CTACGACGTC GTCAGCGCCT TCATCAAGAG CATGCGCGGC 
TCGGACCCCG ACGCCGCCCT GCACTACCTC GCCCGCATGA TCGAGGCGGG GGAGGACCCC 
CGCTTCATCG CCCGACGCGT GGTCGTGCAC GCCAGCGAGG ACGTCGGCAT GGCCGACCCC 
ACCGCCCTGC AGACCGCCGT GGCCGCCGCC CAGGCCGTGG AGCTCATCGG CATGCCCGAG 
GCCCGCATCA ACCTCGCCCA GGCCGTCATC CACATCAGCC TGGCCCCCAA GTCCAACGCG 
GTCGTCTCCG CCATCGACGC CGCCGCGGCC GACGTGCGCG CGGGCCTGGC CGGGCCCGTC 
CCCGCCCACC TGCGCGACGG CCACTACCGG GGCGCCGCCG AACTCGGCCA CGGCAAGGGC 
TACCGCTACG CCCACGACTT CCCCGGCGGC GTCGCCCCCC AGAGGCACGC CCCCGACGGC 
CTCGCCGACC GCGAGTACTA CCGGCCCACC CAGCACGGCG CCGAACGGCG CTTCGGCGAG 
GTCCTCCAGC GCATCAAGGA GGTCCTGCGG GGCGGCGGGC AGCGCGGCTG A

Protein sequence

MPSAAYPGQV SDTLFDDAGA EAARGQEPLA VRMRPRTLDE VVGQRHLLGE GSPLRRLVED 
DAPMSVFLWG PPGTGKTTLA TVVSRVTKRR FVELSAVNAG VKDVRAVIDD ARRRMGMHGT 
RTLLFVDEVH RFNKTQQDAL LPAVENRWVS FIGATTENPF FSVVSPLLSR SLLLSLESLE 
DADVRALVDR ALADERGLDG RYTLSDEGAD HLVRLAGGDG RRSLTYLEAA ALVAGAPGAE 
PVTITAEHVE RAVDRHAVRY DRSGDQHYDV VSAFIKSMRG SDPDAALHYL ARMIEAGEDP 
RFIARRVVVH ASEDVGMADP TALQTAVAAA QAVELIGMPE ARINLAQAVI HISLAPKSNA 
VVSAIDAAAA DVRAGLAGPV PAHLRDGHYR GAAELGHGKG YRYAHDFPGG VAPQRHAPDG 
LADREYYRPT QHGAERRFGE VLQRIKEVLR GGGQRG