Gene Ndas_1046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1046
Symbol
ID	9244892
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1290391
End bp	1291428
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	77%
IMG OID
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_003678995
Protein GI	297560021
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.912273
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.377404
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG AGGCCCTGCT GTCGGTCCGC GACCTGCGGG TCACCCTGCC CGGACGGCGA 
GGGGGCGGGG TCCGCGCCGT GCGCGGGCTC TCCTTCGACG TGCGCCCCGG CGAGGTGCTC 
GCGCTCGTGG GGGAGTCCGG GGCCGGGAAG TCGGTCACCG CCCGCGCCGT CCTGGGCATG 
GCGCCCTACG GCGCCTCCGT CACCGGAAGC GTCCGCCTGG ACGGACAGGA GCTGGTCGGC 
GCACCGCCCG CCGTCCTGCG GACCCTGCGC GGGCGGCGGA TGTCCCTGGT GCCCCAGGAC 
GCGCTCGCCG TGCTCAGCCC CGTGCACACC GTGGGCGCCC AGCTCGTACG CGCCCTGCGC 
TCCGTGCGTC GGATGAGCCG GGCCGCGGCG TGGGAGCGGG CGGTGGCCGC ACTGGACCGG 
GTCGGCATCC CCGACGCCGC CCGACGCGCG CACGCCTACC CGCACGAGTT CTCCGGCGGC 
ATGCGCCAGC GGGCGGTCAT CGCGATGGCC ACGGTCAACG AACCCGACCT GGTGTTCGCC 
GACGAGCCCA CGACCGCCCT CGACCCCAGG ATGCAGGCCC GGACGCTGGA ACTGCTGTGC 
GGGCTGCGGG AGCGGACCGG CACCTCGGTC GTCCTGGTCA CCCACGACCT GGGCGTCGTC 
GGCGGCTACG CCGACCGGGT GGTGGTCGTC TACGCCGGAC GCCACGTCGA GTCGGGCCCG 
GTGGGGCCGG TCCTGACCCG GCCGCGCGCC CCCTACACCG CCGGCCTGGT CGCCGCGCTG 
CCCCGGCCCG GGGCCGGGGA CCGCCGCCTG CCCGCCATCG CCGGAACGCC CCCCTCACCG 
GAGGCGCTGC CCGGCGGCTG CGCCTTCGCG CCCCGCTGTC CGCTGACGGA GGATCGGTGC 
CACGCCGAGG AGCCCTCACC CGCGGTAGCC GGGGAGTCGG GCAGGCTGGT CTCGTGCCAC 
CGCTGGCAGG ACCTGCCCGA CCCGGCTTCC TCCCTGTTCA CGGACACCGC GCACACACCA 
CGGGAAAGGA CGACATGA

Protein sequence

MSDEALLSVR DLRVTLPGRR GGGVRAVRGL SFDVRPGEVL ALVGESGAGK SVTARAVLGM 
APYGASVTGS VRLDGQELVG APPAVLRTLR GRRMSLVPQD ALAVLSPVHT VGAQLVRALR 
SVRRMSRAAA WERAVAALDR VGIPDAARRA HAYPHEFSGG MRQRAVIAMA TVNEPDLVFA 
DEPTTALDPR MQARTLELLC GLRERTGTSV VLVTHDLGVV GGYADRVVVV YAGRHVESGP 
VGPVLTRPRA PYTAGLVAAL PRPGAGDRRL PAIAGTPPSP EALPGGCAFA PRCPLTEDRC 
HAEEPSPAVA GESGRLVSCH RWQDLPDPAS SLFTDTAHTP RERTT