Gene Ndas_0272 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0272
Symbol
ID	9244106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	338942
End bp	340366
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	75%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003678227
Protein GI	297559253
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGCCG CGGCCGACTC CGCGGCGTCC GGGGGCACCG GGCCCGGGGG CGCCGCGGTG 
GGAGGGGCCG CTCCGGAGGC CGCCGCCCGG AGCACGGTCG GCGGGCCGGG CGCTCCGCTG 
CCCCGTTCCG TGCACGCCTG GTACGGCAGC GGCGCGGTGG CCACGGGGAT CTTCAACACG 
GTGCCCGGGC TGCTGCTCCT CATCTACCTG ACCGACACGC TCGCGGTGAG CCCCGCCCTG 
GCCGGGGCGG TGGTGCTCCT GCCCAAGGTG GTCGACCTTC TGGTCAGTCC GTATATCGGG 
ATCTGGTCGG ATAGGACGCG TTCGCCGTGG GGGCCGCGGC GCCCGTGGAT GCTGGCGGGG 
GCGCTGACCC TGCCGGTGCT GTTCGCCGCG ATGTTCGCCG GGCCGCCGCT GAAGGGCGGC 
TCCGCCGCGG TGTACGTGGC GGCCGTGTTC GTGGCCGCCG CGCTGGCCTC GTCGGTGTTC 
CAGGTGCCGC ACACGGCCAT GCCCGGGGAG ATCACCTCCG ACTACCACGA GCGGTCCACG 
TTCAACACGT GGCGGACCGC GTTCGTCGGG CTCGCCCTGA TGCTGGGCGG CGCCTTGGCG 
CCGGTCGTCC AGTCGGCCCC CGCGGACCCC GTGGCCGGGT ACCGGCTGAT GGGCCTGCTC 
ATGGGCTGCG TGGTGCTGGT GTCGATGCTG GGCTCGGTGG TGGGCACGCG CCGGGCGCCG 
CGCCCGGTGT TCGCGCACCG CACGGAGGGT CTGGCGGCCC AGCTGCGGGT GGCCTTCGCC 
CACCGGCACT TCCGGGTGCT CTTCCCCGCC AACCTCCTGA TGGCCACGGC GGGCGGCACC 
ATGGTCGCGG GCGTGCCGTA CGTGACGGCC AACGTCATGG GCGAGCCGGG CTACACGAGC 
GTGCTCATGG TGTGCGTGCT GGTGCCGCTG ATCGCTTCGG CCCCGCTGTG GCGGTGGCTG 
TCCCTGCGGG TGGACAAGCG CCGCGCCGCC GGGTACGCGG CGGCGGTGTT CGCCCTGGGC 
GGTCTGGGTC TGCTGCTCAT CCCGATCTGG GGCCTCCCCG GCGCCGTGCT GTCCTCCGTG 
CTGGTGGGCG TGGGTCTGTC GGGGACGACG CTGCTGCCGT GGTCGATGCT GGCCGACTGC 
CTGGCCACCG CCGACGCCTC CGGGCGGCGG CAGGGCGGCG TGCTCTCGGG CGTGTGGACC 
GCCGGGGAGG CCATGGCGCA GTCGGTGGGA ACCGGGCTGC TGTCGCTGGC CTTGGCGGTG 
AGCGGCTACG TGGAGTCCGG GGCCGGGGAG GCGGTCCGGC AGAGCGACGA GGCGCTGCGC 
GGCATGCTGG TCGGCAGCAC GCTGGTGCCC GCCGCGGTGA TGCTGTGCTG CCTGGTGCCG 
CTGGCGTTCT ACCGGCTGAC CGCCGAGGAG GCGGGCCCGC GCTGA

Protein sequence

MTAAADSAAS GGTGPGGAAV GGAAPEAAAR STVGGPGAPL PRSVHAWYGS GAVATGIFNT 
VPGLLLLIYL TDTLAVSPAL AGAVVLLPKV VDLLVSPYIG IWSDRTRSPW GPRRPWMLAG 
ALTLPVLFAA MFAGPPLKGG SAAVYVAAVF VAAALASSVF QVPHTAMPGE ITSDYHERST 
FNTWRTAFVG LALMLGGALA PVVQSAPADP VAGYRLMGLL MGCVVLVSML GSVVGTRRAP 
RPVFAHRTEG LAAQLRVAFA HRHFRVLFPA NLLMATAGGT MVAGVPYVTA NVMGEPGYTS 
VLMVCVLVPL IASAPLWRWL SLRVDKRRAA GYAAAVFALG GLGLLLIPIW GLPGAVLSSV 
LVGVGLSGTT LLPWSMLADC LATADASGRR QGGVLSGVWT AGEAMAQSVG TGLLSLALAV 
SGYVESGAGE AVRQSDEALR GMLVGSTLVP AAVMLCCLVP LAFYRLTAEE AGPR