Gene Ndas_4702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4702
Symbol
ID	9248584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	5582045
End bp	5583238
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	72%
IMG OID
Product	ABC-2 type transporter
Protein accession	YP_003682594
Protein GI	297563620
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.595604
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.45539
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAACG GAACCAACGC CCTCTCCATG ACCGCGGCCA TCGTCGCCAA GGACGTGCGC 
CAGCGGCTGC GGGACGGCAG CCTGCTGGTC TTCGGGCTGC TCCTGCCGCT CGGGGTGGCC 
TTCTTCTTCA ACATGCTGCT CGGCGACGGG ACGTCCCAGG GGACGAGCTC GGAGTACGTG 
GTCGTCGACG GCGACTCCGG ATCGCTCGGC GAGGGCTTCG TCGACGAGGC GCTGCGCCCC 
CTGGAGGACG ACGGGGTGCT GGAGCTGTCC GAGGCCGGTT CCGAGCGCGA GGCGCGCGAG 
GCGGTCGAGG CGGGGGCCGC CGACGCGGCC TTCCTCATCC CCGAGGACTT CACCGAGTCG 
CTGGAGGCGG GCGAGGACGC GGTCCTCACC GTCGTCGGCG ACGCCGACTC CCCCGTGGCC 
ACCCACATCG CCCGGGAGAT CGGCCGCGCC TACGCCACCG AGCACCACCG CATCCGACTC 
GCGATCGCCA CCGGCTTCGA CTCCGAACCC GACCCGGCCG CCGCGGCCCG GCTCCTGGAG 
GAGGCGGAGA CGGCGGCGCC GCCGCTGACG GTGGTCGAGG ACGCGGACCT GGAGTGGCGG 
GAGCTGGGCA CCGCCACCTA CTACTCGGCC TCCATGGCGT TCTTCTTCGT CTTCTTCGCG 
GCGATGTTCA GCGTCACCAG CATCTTCGAC GAGAAGGCGG GCGGGACCCT GGCGCGCCTC 
CTGGCCAGCC CGATCCCGCG GGGGGCGATC CTGGTCGCGA AGCTCTCCAG CGGACTGCTC 
ATCGGCCTGG CGAACATGGC GGTCCTGGCC GTCGCGACGA CCCTGTTCTT CGGCGCCGAC 
TGGGGCGACC CGCTGGGCGC GGCGGCGCTG ATCACCACGG GCGTGCTGGC CGTCATCGGG 
CTCACCGCCG CCGTGGCGAG CTTCGCGCGC AGCTCGGAAC AGGCCGCCAA CTGGCTCTCG 
GTCCTGGCGA TGCTGCTCGG AGCGTTCGGT GGAGCGCTGT TCCCGATCTC GCAGCTCAAC 
GCGCTGGCGG TCGTCAGCTA CCTGACCCCC CACCGGTGGT TCCTGCTCGG CCTGGGCGAG 
CTCTCGGCGG GAGGCGTCGG CTCGGTCCTC CTGCCGTGCG CGGTCCTGCT CGCGCACGGC 
CTCGCCGGCT CGACCGTCGC GCTGTTCCGT ATGGGACGGA TGGTGAACTC ATGA

Protein sequence

MANGTNALSM TAAIVAKDVR QRLRDGSLLV FGLLLPLGVA FFFNMLLGDG TSQGTSSEYV 
VVDGDSGSLG EGFVDEALRP LEDDGVLELS EAGSEREARE AVEAGAADAA FLIPEDFTES 
LEAGEDAVLT VVGDADSPVA THIAREIGRA YATEHHRIRL AIATGFDSEP DPAAAARLLE 
EAETAAPPLT VVEDADLEWR ELGTATYYSA SMAFFFVFFA AMFSVTSIFD EKAGGTLARL 
LASPIPRGAI LVAKLSSGLL IGLANMAVLA VATTLFFGAD WGDPLGAAAL ITTGVLAVIG 
LTAAVASFAR SSEQAANWLS VLAMLLGAFG GALFPISQLN ALAVVSYLTP HRWFLLGLGE 
LSAGGVGSVL LPCAVLLAHG LAGSTVALFR MGRMVNS