Gene Ndas_1702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1702
Symbol
ID	9245552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2073764
End bp	2075185
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	69%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003679637
Protein GI	297560663
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.254486
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.472051
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCCGA CAAGCGTCTC CGCGCGTTTT CTCCCCCTGG CGGTCGCCGC GCTGGCGGTC 
ATCGGCTTCG TCTCGGTACT GGTCAGTTCG GTCACGTCGA TGGCGCTCAC CACCCTGGCG 
GAGGCTCTTG GGACCTCCAT GAGTTCGATC GTGTGGGTTA CGACGGTCTT CTTGCTGACG 
GCAGGACTGG CGCTCCCCTT CGCCGGGTGG GCCGTGGACC GATTCGGCGG CCGCCCGGTG 
CTGCTGGTGG GTCTCGCGGT TTTCGCGGCG GGTGCGCTGG GAAGCGGATC GGCGGTGACG 
TTCGAACAGC TCATCGCGGC ACGTGCCGTG CAGGGGCTCG GCGGCGGAGT CCTGGAGTCC 
GCCTGCCTGG CCTTGATCTC GCAGATCACC GATCGCCGAC GCATCGGCGC GGTCATGGGG 
CTGATGTCCA TGGTGATCAA CCTCGCCCCG GCGGTCGGAC CCGTCATCGG CGCCGCTCTG 
TTGTCCGCCG CGGGTTGGCG CAGCGTCTTC CTCTTCGCCG TACCGCCCAT CCTCCTGGCT 
GGCGTGCTCC TGGCTCTTTC CCTGGGTCAG TGGAGAACGT CCCCCGGCAC CGACTCATCA 
GCCCCAGGGG CAGCTCAGGC CCACCGGTTC GACCTTGTCG GCCTGGCCCT GCTCGGTCTC 
GGCTTCACCG CAAGCCTGTT CGCCATCGGT CGGCTCTCCG CTGGAACGCC ATGGTCAACG 
CTCACCGCGG GTGTACTGGG CGCACTGCTG TTGGTGGTCT ACGTCCGGCG TTCTCTGCGC 
GTACCCGCGC CGATCATCGA CCCGCGGCTG TTCACCGACC GTCGCTTCTC CGGAGCCGCC 
GCGATCATGG GTATGGGTGG CGTGCTGCTG TTCTCCACAC TCACTCTCGT GCCCCTGCTG 
GCCGCACGGT CATGGGATCT CAGCGGGCTC ACCGAGGCCG TGCCACTGGC GGCCTTCGGA 
ACGGGGATGC TGGTGTCGAT GAGCGTCGCT GGAGCGCTCT CGGACCGCGT CGGATCCCGA 
AGGATCGTCA CCACCGCGGC GGCCTGTTCA GCGGGTTCCC TGGCTCTCCT GGCGGCCTGC 
GCGCAACTCC TGCCCTCCCC CGCGTTGGTG TGCACGCTCC TTCTGTGCCT CACCGGCCTC 
TCGTTCGGAG CGGTCTCCGC GCCGACTTTC GCCAGCATCT ACCGCATACT CCCGGCAGCG 
ATGGCCGGGA GGGGCACCAC GGCCGTCCTG CTCGTCGTTC AGCTCGGCGC GGCACTCGGC 
GTCACCGGGA TCGGATCCCT GGTCGGTGCT GTGGGCAGTC GTTCCCACAC AACCGTGCTC 
GTGCTGCTCG CGGGGCTCAT GCTCACAGCA GCCGGTGTCG CCGCACTGGC CCTCTCCCGG 
GAGGCGAGTG CGCGACACGC CGATGATCGG ACCACGCGGT AG

Protein sequence

MMPTSVSARF LPLAVAALAV IGFVSVLVSS VTSMALTTLA EALGTSMSSI VWVTTVFLLT 
AGLALPFAGW AVDRFGGRPV LLVGLAVFAA GALGSGSAVT FEQLIAARAV QGLGGGVLES 
ACLALISQIT DRRRIGAVMG LMSMVINLAP AVGPVIGAAL LSAAGWRSVF LFAVPPILLA 
GVLLALSLGQ WRTSPGTDSS APGAAQAHRF DLVGLALLGL GFTASLFAIG RLSAGTPWST 
LTAGVLGALL LVVYVRRSLR VPAPIIDPRL FTDRRFSGAA AIMGMGGVLL FSTLTLVPLL 
AARSWDLSGL TEAVPLAAFG TGMLVSMSVA GALSDRVGSR RIVTTAAACS AGSLALLAAC 
AQLLPSPALV CTLLLCLTGL SFGAVSAPTF ASIYRILPAA MAGRGTTAVL LVVQLGAALG 
VTGIGSLVGA VGSRSHTTVL VLLAGLMLTA AGVAALALSR EASARHADDR TTR