Gene Ndas_1335 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1335
Symbol
ID	9245185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1641000
End bp	1642313
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	72%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003679273
Protein GI	297560299
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTCGTCG GCAGCGGCAC CGCCAACGCC GTCGGCCCCC AGATGTACCT GGCCACCATC 
GGCCTGTTCG TACTGCCGAT CGTCGAGGAC ACCGGCTTCA GCCGCACGAC CGTCACCGGG 
GCCTTCTCGG TCGCGGCGGT CGGGATGGCG ATCGGCCTGG TCATCGTCGC CCAGCTCGTG 
GACCGCTTCG CCGCGCGGTA CATCCTCGTG CCGGGGTTCG TGCTGTTCGC GGCCTCGATG 
GCGCTGATCG GGCTGGTGCC GCCGGTCGAG TGGGTCTACC TCGTCCCGTG CTTCTTCGTG 
GGCTTCTTCG GGGCGGGGAC GGCCGTGCCC GCCACCAGGG CGGTGGTGAG CTGGTTCGAC 
AACAACCGCG CCCTCGCCGT CGGAGTGGTG ACGGGCATCA TCGGCCTGGG AACGGCCCTT 
GCCCCCATCC TGGCCGGAGC GCTCATCGAA GGCGTCGGAT GGCGGGGGGC CTACGGCCTC 
ATGGCGCTGA TCTCGGTCCT GGTGTCGGTC ACGATGGTCA CCCTGTTCGT GCGCGCCCGC 
GCCGAGCGGC ACGTCCGCGG ACGACTCGTC CAGGAGACCC GGGTGGAGGG CCGTGAGGTC 
AGCCTCGAAC TCCCCGGCCT GACGGTCGGC GAGGCGGTCC GCACCCGGCA GTTCTGGGCC 
ATCGCGCTCG GACTGGGACT GGTAGGGGTC GTCGTCTACG GCCTCCAGGT CCACCTCGTG 
CCGATGATGA CCGACCGGGG GCTGAGCGCC GACCAGGCCG CCACCCTGCT GGTCGTCTTC 
GGTCTCGCCT CGCTGGTGGG CCGGGTGGCG GGCGGCCTCA TCCTCGACCG GGTGCACGCG 
TGCGTCATCG GTCCGATCGT GATGATCGCC CCCATCGCCG GGATGTTCTT CCTGGAGCCG 
CCGTTCGGCG GCGCCGTCGT CGCGGTCGCC TTCATCGGCG TCGCCTTCGG CATCGAGGGC 
GACCTGCTCG CCCTGCTCAT CACCCGCTAC CTGGGCACGC GCTACTTCGG TCGGATCCTG 
GGCCTGGTCC AGGCCGCGTT CCTCCTGGGC AGCGCGCTGG GGCCGCTGCT CCTCGGACTG 
GGGTACGACC TGCTGGGCTC CTACGACCCC GTCATGCCCG TCCTGATGGG CGTCCTCGTC 
GTCGGCGCGG TCCTCATCGC GACCCTGGGC CGCTACGTCT ACCCCGCCGT CAACGGCTTC 
GACCGTCTCG CCGCCCGCGA CGAACTCGCC GCCGCCGAGG TGCTGAGCGA CATCGCCGGG 
ACCGGCGACG CCCACGGCTC CCCGGACAGG CCGCGGGCCG AGGCCCACGG CTGA

Protein sequence

MLVGSGTANA VGPQMYLATI GLFVLPIVED TGFSRTTVTG AFSVAAVGMA IGLVIVAQLV 
DRFAARYILV PGFVLFAASM ALIGLVPPVE WVYLVPCFFV GFFGAGTAVP ATRAVVSWFD 
NNRALAVGVV TGIIGLGTAL APILAGALIE GVGWRGAYGL MALISVLVSV TMVTLFVRAR 
AERHVRGRLV QETRVEGREV SLELPGLTVG EAVRTRQFWA IALGLGLVGV VVYGLQVHLV 
PMMTDRGLSA DQAATLLVVF GLASLVGRVA GGLILDRVHA CVIGPIVMIA PIAGMFFLEP 
PFGGAVVAVA FIGVAFGIEG DLLALLITRY LGTRYFGRIL GLVQAAFLLG SALGPLLLGL 
GYDLLGSYDP VMPVLMGVLV VGAVLIATLG RYVYPAVNGF DRLAARDELA AAEVLSDIAG 
TGDAHGSPDR PRAEAHG