Gene Ndas_1490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1490
Symbol
ID	9245340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1825723
End bp	1827021
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	71%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003679426
Protein GI	297560452
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.81003
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0711824
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGAGC GGACCGCCCC CACGTCCTCG CACCCCGCGC GTGCGGCCGT GGCGGCCTTC 
GTCGGCACCA CCATCGAGTG GTTCGACTTC TACGTCTACG CCACGGCCGC CAGCCTGGTG 
TTCGGCACCC TGTTCTTCCC GCCCGGCACC GACCCGGTGA TCGGCTTGAT GGCCTCCTTC 
GCCACCTTCT CGGTGGGCTT CTTCGCCCGA CCGCTGGGCG GCCTGGTCTT CGGCCACTTC 
GGCGACCGCC TGGGCCGCAA GTCCGCGCTG GTCGTCACCC TGTTGATGAT GGGCACGGCC 
ACGTTCTGCG TGGGTCTGCT GCCCACCTAC GAGCAGGCGG GGTTCCTCGC CCCGGCGCTG 
CTGGTCCTGC TGCGCTTCGT CCAGGGCATC GCCGTGGGCG GGGAGTGGGG CGGCGCCGTC 
CTGATGGCGG TCGAGCACGC CCCCGAGGAC CGCAAGACCT TCTACGGCTC CTTCGCCCAG 
CTCGGCAACC CGGCCGGTGC GCTGCTGGCC ACGGGCTCGT TCGGGCTCAT CGCCGCCTGG 
GACGCCGACC TGCTCCACAC CTGGGGCTGG CGCCTGCCCT TCCTCGCCTC GGTCCTGCTG 
GTCCTGGTGG GCCTGTTCAT CCGCCTGAAG GTGGAGGAGT CGCCGGTCTT CGAGGCCATG 
CGCGAGGACA CCGACCAGCC GCGGGAGCTG CCGCTGCGCG AGGCCGTGCG CGGTTCCTGG 
CGCCCGCTGC TGCTGGGCAT CGGCGTCCTG CCGGTGGCCG TCGGCGGCTA CTACGTCGTC 
ACCACCTTCC TCCAGGCCTA CGGCGTCACC GAGGTCGGCA TCAGCGAGCA GGTCATCCTC 
AGCGGCCTGA GCCTGGCCGC GTTCGTCGAA CTCGTCGCGA CCCTGGGCGT GTCCTGGCTG 
GGCGACCGCT TCGGCACCGT CCGCGTCGTC ACCATCGGAC TGGTCGGCGT CATCGTGCTG 
GCGCTTCCCC AGTTCCTGGT GCTGGAGACC GGCAGTACCG TGCTGATCTT CGTGGTGCTG 
TGCGTGATGC GCCTGGCCAT GGCCGCGGTC TACGGGCCCA TCGCCCGCGT GCTCGCCCAG 
ATGTTCCCGC CGCGCACCCG CTACACCAGC ATCTCCATCG CCTACCAGGT CGCGGGGGCG 
ATCTTCGGCG GCCTGTCGCC GATCGTGTGC ACCGCCCTGC TCGCCGCCAC CGGCAGCATC 
CTGCCGGTGG CGGGCCTGCT CATGGCCATG GCCGTGGTGA GCATCCTGTG CCTGGCCCGG 
GCGCCGCGCC ACCGCGACAG CGACCTCGCC ACCGCCTGA

Protein sequence

MSERTAPTSS HPARAAVAAF VGTTIEWFDF YVYATAASLV FGTLFFPPGT DPVIGLMASF 
ATFSVGFFAR PLGGLVFGHF GDRLGRKSAL VVTLLMMGTA TFCVGLLPTY EQAGFLAPAL 
LVLLRFVQGI AVGGEWGGAV LMAVEHAPED RKTFYGSFAQ LGNPAGALLA TGSFGLIAAW 
DADLLHTWGW RLPFLASVLL VLVGLFIRLK VEESPVFEAM REDTDQPREL PLREAVRGSW 
RPLLLGIGVL PVAVGGYYVV TTFLQAYGVT EVGISEQVIL SGLSLAAFVE LVATLGVSWL 
GDRFGTVRVV TIGLVGVIVL ALPQFLVLET GSTVLIFVVL CVMRLAMAAV YGPIARVLAQ 
MFPPRTRYTS ISIAYQVAGA IFGGLSPIVC TALLAATGSI LPVAGLLMAM AVVSILCLAR 
APRHRDSDLA TA