Gene Ndas_3402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3402
Symbol
ID	9247269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4068167
End bp	4070035
Gene Length	1869 bp
Protein Length	622 aa
Translation table	11
GC content	71%
IMG OID
Product	ABC transporter related protein
Protein accession	YP_003681313
Protein GI	297562339
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAATGA TGTCCGGCAG GCCCTCCTAC AGGGCCCTGG TCAACGACGG GAGCGCGAAG 
GGGCAGTCAC TGCCCCCCGG AATCACCCGA CGCATCATCT CCTACGCCCG CCCGCACTGG 
CGGGTGATCC TGTGTTTCCT GTTGGTGACG ACGGTCGGCG CCGGGATCGT GGTCGCCAAC 
CCGCTCCTGC TCAAGGCCAT CATCGACCGC GGCATCCTGA CCGGGAACAC CGCGCTGGTG 
GTGTGGCTGG CGCTCGCCGC GGCGGGGCTG GCGGTGCTGG AGAGCGGACT GACCCTGCTC 
GGCAGGTGGC TGTCCTCCCG GATCGGCGAG GGGGTCATCT ACCAGCTGCG CACGCAGGTG 
TTCACCCACG TCCAGCGGAT GCCGGTGGCC TTCTTCACCC GTACGCAGAC GGGGTCGCTG 
ATCAGCCGTC TGAACACGGA CGTGGTGGGC GCGCAGCGGG CGATCACCTC CGTCCTGCAG 
TCGGTGGTGT CCAACGTGGT GAGCGCGACC GCGGTGATCG TGACGATGAT CGCCCTGTCG 
TGGCAGGTGA CGCTGATCGC GCTGGCCCTG GTTCCGCTGT TCGTGGTCCC CGCCAAGGTG 
ATCGGGCGAC GGCTGGCGCA CATCTCCCGC GACGCGATGG ACACCAACGC GGACATGAGC 
TCGCTGATGA CCGAGCGGTT CAACGTCGGC GGGGCGATGC TGGTCAAGCT GTACGGACGC 
CCCGAGGAGG AGTCGGCGGG GTTCGCCCGG CGCGCGAGCC GGGTCCGGGA CCTGGGCGTG 
CGCCAGGCGG TGTTCGGCTC GCTGCTGTTC AGCATGCTGG GCCTGATCAC GGCGCTGGCC 
ATGGCGATGG TCTACGGGGT CGGCGGCGTG CTGGCGATCG GCGGGGCCTT CGAGGTGGGC 
ACGCTGGTGG CGCTGACCAC CCTGCTCGCC CGCCTGTACG GGCCGGTGAC GACGCTGTCC 
AACGTGCACG TGGAGATCAT GACCGCGCTG GTCTCCTTCG ACCGGGTCTT CGAGGTGCTG 
GACCTGGAAC CGGGCATCAG GGAGAGCCCC GACGCACGGA ACCTGCCCGG GGAGCGTCTG 
GGCGTGGAGT TCGACAACGT GTCGTTCCGC TACCCGGCGG CGAAGGAGTC GTCGGTGGCG 
TCGCTGGAGC TGACGCCGCA GGCGTCGGTG GACGAGGACA CCCAGGTGCT GAGCGGGGTG 
TCGTTCCGGG CGGAGCCGGG GACGATGGTG GCCCTGGTGG GGCCGTCCGG AGCGGGCAAG 
ACGACGCTGA CGCACCTGGT GTCGCGCCTG TACGACCCGA CCGAGGGCCG GGTGCTCGTC 
GGCGGGCTGG ACCTGCGCGA GGTGACCGGC GACTCGCTGC GCGAGGCGGT CGGCGTGGTC 
ACCCAGGACG CGCAGCTGTT CCACGACACC GTGGGGGCGA ACCTGCGGTA CGCCCGGCCG 
GAGGCGACCG ACGCCGAGCT GGAGGAGGTG CTGCGGATGG CGCGGCTGGG CACCCTCCTG 
GACCAGCTGC CCAACGGGCT GGACACGATG GTCGGCGACC GCGGGTACCG GCTGTCGGGC 
GGTGAGAAGC AGCGGCTGGC GATCGCGCGT CTGCTGCTGA AGGCGCCGTC GGTGGTGGTG 
CTGGACGAGG CGACGGCCCA CCTGGACTCC GGGTCCGAGG CGGCAGTGCA GGAGGCGCTG 
TCCGTGGCGC TGGAGGGCCG GACCTCGCTG GTGATCGCGC ACCGGCTGGC GACGGTGCGC 
GAGGCGGACC AGATCCTGGT GCTGGAGGAC GGCCGGATCC TGGAGCGCGG CACGCACGAC 
GAGCTGCTGG TCCAGGGCGG GCTGTACACG GCGCTGTACC GGACCCAGTT CGCTCCGCAG 
AGCCGGTAG

Protein sequence

MTMMSGRPSY RALVNDGSAK GQSLPPGITR RIISYARPHW RVILCFLLVT TVGAGIVVAN 
PLLLKAIIDR GILTGNTALV VWLALAAAGL AVLESGLTLL GRWLSSRIGE GVIYQLRTQV 
FTHVQRMPVA FFTRTQTGSL ISRLNTDVVG AQRAITSVLQ SVVSNVVSAT AVIVTMIALS 
WQVTLIALAL VPLFVVPAKV IGRRLAHISR DAMDTNADMS SLMTERFNVG GAMLVKLYGR 
PEEESAGFAR RASRVRDLGV RQAVFGSLLF SMLGLITALA MAMVYGVGGV LAIGGAFEVG 
TLVALTTLLA RLYGPVTTLS NVHVEIMTAL VSFDRVFEVL DLEPGIRESP DARNLPGERL 
GVEFDNVSFR YPAAKESSVA SLELTPQASV DEDTQVLSGV SFRAEPGTMV ALVGPSGAGK 
TTLTHLVSRL YDPTEGRVLV GGLDLREVTG DSLREAVGVV TQDAQLFHDT VGANLRYARP 
EATDAELEEV LRMARLGTLL DQLPNGLDTM VGDRGYRLSG GEKQRLAIAR LLLKAPSVVV 
LDEATAHLDS GSEAAVQEAL SVALEGRTSL VIAHRLATVR EADQILVLED GRILERGTHD 
ELLVQGGLYT ALYRTQFAPQ SR