Gene Ndas_4847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4847
Symbol
ID	9248733
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	5743990
End bp	5745285
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	74%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003682736
Protein GI	297563762
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCTTCT TCGGTGATCT GCGCGTGGTC CTGCGGGGGC CCCGGTTCCG CCGCCTGTTC 
GGCACCCGGC TGGTGGCGCA GTTCTCCGAC GGGGTGTACC AGGCCGGGCT GGCGGGCTTC 
GTCTTCTTCA CCCCCGAGCA GCACACCAGT GCGGGCGCCG TCGCCGCGGC CTTCGCGGTG 
CTGCTCCTTC CGTTCTCGGT GGTGGCGCCG TTCGCCGGGG TCCTGATCGA CAGGTGGCCC 
CGGCGCCAGA TCCTGCTGCT GTCCTCCCTG GCCAAGGCGG CGCTCGCGGT GGCGAGCGCG 
TTCCTGGTGG CACGGGGCGA GAGCCCCGCC TTCCTCCTCA CCGCGCTCCT GGTGCTGAGC 
GTCAACCGCT TCTTCCTGTC CGGGCTGTCC GCCGGACTGC CCTACGTGGT GGCCCGGGAC 
AAGCTGATGA TGGCCAACGC GGTCACGCCC ACCAGCGGTA CCGCGGCGAG CTTCCTGGGC 
GCGGGGGCGG GCGCCGCGAT CGGGCTGCTC GGCGGCGAGG ACGCCCTGGG CACCGGGCTC 
ATCCTGTCCA TGGCCGCGCT CGGCTTCGCC GGGGCGGCGC TGGTCTCCCT CACCCTGGGC 
CACGACGAGC TGGGACCGCA CCTGGAGCGG GAACCGGACG AGGTCGCGGC GGCCGTGCGC 
AACGTGGTGC GGGGCATGGT CTCGGGGGTG CGCCACCTCT GGGCGCGCCC GGAGGCCCGC 
GACGCGCTGC TCACGATCGG CGGCCACCGG GTGCTGTTCG GGATCTCCAC GCTGCTGACG 
CTGCTGCTGT ACAACAACAC CTTCACCGGC GGCGGTGTGG CCGGACTGGC CGGTTTCTCG 
GTGGCGATGG GCCTGTCGGG GGCGGGGTTC CTGGTGGGCG CGGTGGCCAC GCCGTGGGCG 
ACCGCCCGGA TGGCCCCGGG GGCGTGGATC GTGCTGCAGC TGGCGGCGGC GTCGGCGGTC 
CTGGTGGTGT TCGGACTGCC CTTCTCACCC GTGCTCTTCC CCGTGGCCGC GTTCGCGCTG 
GGCTTCGTCT CCCAGGGGGT CAAGGTCACC GTCGACACGT TGGTTCAGCG ACATGTCGAC 
GACGCGTTCC GGGGGCGGGT GTTCTCGGTG TACGACGTGC TGTTCAACGC CACGTTCGTC 
CTGGGCGCGG CGCTGGCCGC CGCGCTGGTC CCGCCGTCCG GGGTGAACCC CGCGGTGGTC 
GTCGCGATGG CCGCGGCCTA CCTGGTGATG GGCGCCGCCT GGGTCGTGCG CGGGCGCCGC 
GCCAGCGCCG CCGAGGCGGA GCGCGAGGTC GCGTAG

Protein sequence

MSFFGDLRVV LRGPRFRRLF GTRLVAQFSD GVYQAGLAGF VFFTPEQHTS AGAVAAAFAV 
LLLPFSVVAP FAGVLIDRWP RRQILLLSSL AKAALAVASA FLVARGESPA FLLTALLVLS 
VNRFFLSGLS AGLPYVVARD KLMMANAVTP TSGTAASFLG AGAGAAIGLL GGEDALGTGL 
ILSMAALGFA GAALVSLTLG HDELGPHLER EPDEVAAAVR NVVRGMVSGV RHLWARPEAR 
DALLTIGGHR VLFGISTLLT LLLYNNTFTG GGVAGLAGFS VAMGLSGAGF LVGAVATPWA 
TARMAPGAWI VLQLAAASAV LVVFGLPFSP VLFPVAAFAL GFVSQGVKVT VDTLVQRHVD 
DAFRGRVFSV YDVLFNATFV LGAALAAALV PPSGVNPAVV VAMAAAYLVM GAAWVVRGRR 
ASAAEAEREV A