Gene Ndas_1859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1859
Symbol
ID	9245709
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2270005
End bp	2271612
Gene Length	1608 bp
Protein Length	535 aa
Translation table	11
GC content	74%
IMG OID
Product	ABC transporter related protein
Protein accession	YP_003679793
Protein GI	297560819
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0744608
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.494788
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACCA AGTCCGCCGT CACACTCACC GACCTCACCT TCGCCTGGCC GGACGGCACG 
GTCGCGATCG ACCACGTGAG CGGCACCCTC ACGACCGGGC GCACCGGGCT CGTCGGCCGC 
AACGGCGCGG GCAAGTCCAC CCTGCTGCGC CTGATCGCCG GTCACCTGCG CCCCACCTCG 
GGGCGCGTCG ACGCGGTCGG CGACGTCGGC TACCTCCCGC AGACCCTGAC CCTGGGCACG 
GAGGCGACGG TCGCCGAACT GCTCGGCATC GACGCCACCC TCGCCGCGCT CCGCGCGATC 
GAGGCGGGCG ACGCCGACGA ACGCCACTTC GACGCGGTCG GCGACGACTG GGACATCGAG 
GCGCGCGCCG ACGAGGCCCT GCACGAGATC GGGTTCACCG CCGCCGACCT CGACCGCCGC 
GTCGCGCAGG TCTCCGGCGG TGAGGCGGTA CTCATCGCCG TCACCGGCAT GCGCCTGCGG 
CGCACCCCGA TCACCCTGCT CGACGAGCCC ACCAACAACC TCGACCGGCC CACGCGGGCC 
AGGCTCGCCG CGTTCGTCGA CACCTGGCCC GGCACCCTCG TCGTCGTCAG CCACGACCTC 
GAACTGCTCG AACACATGGA CAGCACCGCC GAACTCCACG CCGGGAGCCT CGACGTGTTC 
GGCGGCCCCT ACAGCGCCTG GAAGGAGCAC CTCGAACAGG AGCAGGCCTC CGCCGTCCAG 
GCGGCCCGGT CCGCGCAGCA GGCCCTCAAG GTCGAGAAGC GCCAGCGCGT GGAGGCCGAG 
ACCAAGCTCG CCCGCCGCGA GCGCACGGCC AGGAGGACGC AGAAGGACGG CGGCATCCCC 
AAGATCCTCG CGGGCAACCG GGCCAGCAAG GCGCAGGCCT CGGCCGGGGC GATGCGCTCG 
ACCCTCGACG ACAAGGTCCA GGCCGCGCAG GCCGCGGTCG ACGCCGCCGA CGCCCGCGTA 
CGCGAGGACG AGCACATCCG CCTCACGCTG CCCGATCCGG ACGTGCCGCG CGGCCGCCGC 
CTGGCGGAGT TCCACGCCGA GGGACGCACC GTCGTCGTCC AGGGTCCCGA ACGCGTCGCC 
CTGGTCGGCC CCAACGGCGC CGGGAAGTCG ACCCTGCTCC AGCAGCTCGT CCACGGCGGC 
GATCCGGTTC CGGGCCGCGC GCACGGCACG CTCCTGACCG ACCGCGTGGG GTACCTGCCC 
CAGCGCCTGG ACGGCCTTGA CGACGCCGCG AGCGCGCTGG AGAACGTGCG GGCGGTCGCC 
CCCGGCACGC CGCCGGGGGA GGTCCGCAAC CAGCTCGCCC GCCTGCTGCT GCGCGGGGAC 
GGCGTCGACC GCCCCGTCGC CACGCTCTCC GGCGGCGAGC GGTTCCGCGT CTGCCTCGCC 
ACGCTGCTCC TGGCGGAGCC GCCCGCGCAG CTGCTCGTCC TGGACGAGCC GACGAACAAC 
CTCGACACCT CCAGCGTCGA GCAGCTCGCC GAGGCCCTCG ACGCCTACCG CGGCGCGCTC 
CTGGTCGTCA GCCACGACCA CGGGTTCCTG CGCAGGATCG GGATCGACAC CGTCCTGGAG 
ATCGGCCGGG AGGGCGGCCT GCGCCAGCGC GCCGAATTGG GGGACTGA

Protein sequence

MSTKSAVTLT DLTFAWPDGT VAIDHVSGTL TTGRTGLVGR NGAGKSTLLR LIAGHLRPTS 
GRVDAVGDVG YLPQTLTLGT EATVAELLGI DATLAALRAI EAGDADERHF DAVGDDWDIE 
ARADEALHEI GFTAADLDRR VAQVSGGEAV LIAVTGMRLR RTPITLLDEP TNNLDRPTRA 
RLAAFVDTWP GTLVVVSHDL ELLEHMDSTA ELHAGSLDVF GGPYSAWKEH LEQEQASAVQ 
AARSAQQALK VEKRQRVEAE TKLARRERTA RRTQKDGGIP KILAGNRASK AQASAGAMRS 
TLDDKVQAAQ AAVDAADARV REDEHIRLTL PDPDVPRGRR LAEFHAEGRT VVVQGPERVA 
LVGPNGAGKS TLLQQLVHGG DPVPGRAHGT LLTDRVGYLP QRLDGLDDAA SALENVRAVA 
PGTPPGEVRN QLARLLLRGD GVDRPVATLS GGERFRVCLA TLLLAEPPAQ LLVLDEPTNN 
LDTSSVEQLA EALDAYRGAL LVVSHDHGFL RRIGIDTVLE IGREGGLRQR AELGD