Gene Ndas_1713 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1713
Symbol
ID	9245563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2084658
End bp	2085956
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	76%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003679648
Protein GI	297560674
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.300423
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.77847
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATCAT GTGCGTACTT GCGCACGTAT ATGGTGCGCC TGGTCGTGCT CTTCCTTCTT 
CTCCGGGTGG TGGTCGTGGT GTGGCGGGTG CTGACGGACT TCGCTTCCTA CCGCAGGTTG 
TTCTACGCCC AGGTCGTGGC GCTGGCGGGC ACCGGGCTGG CCACGGTCGC CCTGGCGCTG 
CTGGCCTACG AACTGGTTCC GGGCCGGGCG GGGCAGGTGG TGGCCACCGC CCTGACCGTC 
AAGATGCTCG CCTACGTGGG CGCGGGGCCG CTGCTGACCG CGGCCCTGGT CCGGGCCCCG 
CGCAAGGCGG TGCTGGTGGG CTCGGACGCG GTGCGCGCCC TGGCGGTGGC CTGTCTGCCG 
TTCGTGGACC AGGTCTGGCA GGTGTACGCG CTCATCGCCG TGCTCCAGTG CGCCTCGGCG 
ACCTTCACCC CCACCTTCCA GGCGGTCATC CCCGAACTGG TGGACGACCG CGGCTACACC 
TCGGCGCTGG CCCTGTCGCG GCTGGCCTAT GACCTGGAGG CGCTGGCCTC GCCGCTGCTG 
GCCGCTCTCG TGCTGCTCGC GATCCCCTTC GACGGCCTGT TCGCGCTGAC CGCGCTCGGC 
TTCGCCGCCT CCGCCGCCCT GGTGGCCGCC ACGGCGCTGC CCGCCCCGAC GCCCGGGTCG 
CGGAGTCCCC GCCGGGCCGC GGCGAGCTGG CGGGCCTTCG GCACCGACCG GCGCCTGCTG 
GCGCTGACGG CGTTGAACAC GGCGGTGGCC GTGGTCACCG CCCTGGTCCT GGTCGACACC 
GTCGTCCTCG TCCGCTCCCA CCTGGGCGGC GGCGACACCG CCGTGGCGTT GGTGCTGGCC 
TGCTTCGGCG GCGGTTCCAT GGCGGTGGCG CTGGCCCTGG GGGCGCTGGT GGAGCGGTTC 
GGCACGCGCG CGCTCATGCT CACCGGTCCC GGCGTCCTCA CGGCGGGAGC GGCGGCCCTG 
GCGCCGGGCT GGGCCCTGGC GCCGGGACCG CTGGTGCTCG GCGCGGGATG GGCGGTGCTG 
GGCGCGGGGT GCGCGCTGGT GTCCGCGCCC ACGGGGCGGC TGCTGCGCGA GGCCGCTCCC 
GAGGGCGCGT TGGCGGGGGT CTTCGCCGCC CAGTTCTCGC TCTCCCACGC CTGCTTCCTG 
CTCACCTACC CGCTGGCCGG GTGGGCCGGG GGCCTGGAAC CGGTCCTGGT GCTGGGCGGC 
GCCGGGGTGC TCACGGGCGC GTGCGCCCTG GCGGCGGCGG GCCTGTGGCG CCCCGGCGCG 
GTCACCGCGG ACCCCTCCCC CGCGGCCGGG GACCGCTGA

Protein sequence

MTSCAYLRTY MVRLVVLFLL LRVVVVVWRV LTDFASYRRL FYAQVVALAG TGLATVALAL 
LAYELVPGRA GQVVATALTV KMLAYVGAGP LLTAALVRAP RKAVLVGSDA VRALAVACLP 
FVDQVWQVYA LIAVLQCASA TFTPTFQAVI PELVDDRGYT SALALSRLAY DLEALASPLL 
AALVLLAIPF DGLFALTALG FAASAALVAA TALPAPTPGS RSPRRAAASW RAFGTDRRLL 
ALTALNTAVA VVTALVLVDT VVLVRSHLGG GDTAVALVLA CFGGGSMAVA LALGALVERF 
GTRALMLTGP GVLTAGAAAL APGWALAPGP LVLGAGWAVL GAGCALVSAP TGRLLREAAP 
EGALAGVFAA QFSLSHACFL LTYPLAGWAG GLEPVLVLGG AGVLTGACAL AAAGLWRPGA 
VTADPSPAAG DR