Gene Ndas_0995 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0995
Symbol
ID	9244841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1216474
End bp	1217658
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	76%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003678945
Protein GI	297559971
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGGAAGAG GCCGCGTCAG GGGGGCGTCG TGGCTCTGGC CGCTGTTACT GAGCGTCATG 
TTCACCCACA CCGCGCTCAA CCTCGCCCGT CCCCTGGTCT CGTACCGGAC GATCGCCCTG 
GGCGGTGACG CCGTGGCGGT GGGCCTGGTC ACCGCCGCCT ACGCGCTGCT GCCCCTGCTG 
GTGGCGGTCC CGCTGGGGCG GGCGACCGAC CGGTCCCGGC GCATGGCGTG GATCGTCGGC 
CTGGGCGCGG CGGTGCTCGG CGCGGGCTCG CTGCTGCTGG CGTACGGCAC GGACCTGTTC 
GCGATCGCCG CGGCCAGCAC GGTGCTGGGC ATGGGCCACC TGCTGTGCAT GGTCGCGGGT 
CAGGGGCTCA TCGCGCGCCT GGCCGCACCG GGGAACCTGG ACCGCGACTT CGGGTGGTTC 
ACCGCGGCGG CCTCCCTGGG CCAGCTCGTG GGCCCCCTGC TGTCGGGTGC GATGCTGGCC 
GACGCCTCGG GGGACGCGCT GCTGTCGGCG ACCTCCTCCG CCCTGCTCGT CGCCGCGGTG 
ACCGGCGGAC TGGGGCTGGT GCCGATCCTG GCCTTCGTCC GGGTTCGCAT GCCCGCGCCC 
TCGCGCAAGA AGGGGTCGGA GAGGACCCCC GCGCGGGAAC TGCTGCGCAG GCCGGGCCTG 
CCCTCGGGGC TGTTCGCCAG CCTCGCGCTG CTCTCGGCCG TGGACATCCT CACCGCCTAC 
CTGCCGCTGG TCGCCGAGAA CCGCGGCATC CCGCCGATGA CGGTCGGCGT CCTGCTGAGC 
CTGCGCGCGG GGTTCTCGCT GCTGTCCCGC CTGGTGCTGT CCCGGCTGGT GCGGCGCTGG 
TCGCGCGAGA CGCTGATCGC GGTCAGCGCC GGGGCCGCGG GCCTGTCGAT GGCGGCGGTG 
GCCCTGCCGG TCAGCAACGT GTTCGTGCTG GGGGCGGTGC TGGCCGTCGG GGGGTTCCTG 
CTGGGTCTGG GCCAGCCGCT GACGATGTCG GCGGTGGCCA CGGCAGCCCC GGAGGGCTCG 
CGCGGGGCCG CCCTGGCGCT GCGGATCTGG GGCAACCGGC TCGGGCAGGT CGGGATCCCT 
GCCGTGGGCG CGGGGGTCGC GGGCGCGGTG GGCGCGCCCG GGGCGCTGTG GTTCGCGGCG 
GTGGTGCTCG TGGCGTCGGC GGTCACGGCG GCCAAGCAGA TCTGA

Protein sequence

MGRGRVRGAS WLWPLLLSVM FTHTALNLAR PLVSYRTIAL GGDAVAVGLV TAAYALLPLL 
VAVPLGRATD RSRRMAWIVG LGAAVLGAGS LLLAYGTDLF AIAAASTVLG MGHLLCMVAG 
QGLIARLAAP GNLDRDFGWF TAAASLGQLV GPLLSGAMLA DASGDALLSA TSSALLVAAV 
TGGLGLVPIL AFVRVRMPAP SRKKGSERTP ARELLRRPGL PSGLFASLAL LSAVDILTAY 
LPLVAENRGI PPMTVGVLLS LRAGFSLLSR LVLSRLVRRW SRETLIAVSA GAAGLSMAAV 
ALPVSNVFVL GAVLAVGGFL LGLGQPLTMS AVATAAPEGS RGAALALRIW GNRLGQVGIP 
AVGAGVAGAV GAPGALWFAA VVLVASAVTA AKQI