Gene Ndas_1066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1066
Symbol
ID	9244912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1312342
End bp	1313832
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	73%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003679014
Protein GI	297560040
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.402473
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCGA CACGCCGGTG GCTGCTGCTG GTGACCGTGG CGGCCGGACT GCTGCTCGTC 
ACCGTGGACA ACACGATCCT GTACACTGCC CTGCCGACCC TGACCGCTCA ACTGGGGGCG 
ACGGGCGCGC AGAGCCTGTG GATCATCAAC GCCTACCCGG TGGTCATGGC CGGTCTGCTG 
CTGGGCAGCG GCACGCTGGG CGACCGGATC GGCCACGTGC GCATGTTCGT GGTCGGGCTG 
GTGGTCTTCG GCCTGGCCTC GCTGGTCGCC GCGTTCTCCC CCACGGCCTG GGTCCTCATC 
GCCTCGCGCG CGCTGCTGGC GGTGGGCGCG GCGGCGATGA TGCCCGCCAC CCTGGCGCTG 
ATCAGGATCG CCTTCCCCAT CGAGCGCGAA CGCAACATCG CCATCGCGGT CTGGGGCAGC 
GTCTCGGTGG TCGGCGGCGC GCTGGGGCCG ATCGTGGGCG GGGTCCTGCT GGAGTTCTTC 
TGGTGGGGGT CGGTCTTCCT CCTCAACGTG CCCGTGGTCA TCGCGGCGCT GGTGGCGACC 
GCGCTGATCG CGCCGCCCAA CGTCCCCGAC CCCGGCAAGC ACTGGGACCT GGTCTCCTCG 
CTCCAGGCCA TGGCCGGGCT GGTCGCCTCG GTGCTGGCGA TCAAGGAGCT GGCGCACACG 
CCGCCGCGCT GGCCGCTCTT CGCCGCCGCC GTGGTCGTGG CCGTGGTGGC CTTCGTCCTG 
TTCACGCGCC GCCAGCGCCG TCTGGAGGAC CCGCTGCTGG ACTTCGGGGT CTTCCGCAAC 
CCCGCCTTCA CCTCCGGTGT GCTGGCCGCG GCGTTCTCGA TGTTCGCCAT CGGCGGCATC 
CAGCTCGTCA CCACCCAGCG CTTCCAGCTG GTCGTGGGCT TCACGCCGCT GGAGGCCGGG 
CTGCTGGTGG CCGCCGTGGC GGCGGGTTCG CTGCCGACCG CGCTGCTGGG CGGGGCGTTC 
CTGCACCGGA CCGGCCTGCT GCCCCTGATC GCGGGAGGTC TCGCCGCAGG CGTGGCGGGT 
GTGGTCGTCT CGCTCCTGGG CTTCCAGACG GGCATCGGCT GGCTCGTCGC GGGGCTGCTG 
CTGACCGGCG CCGGACTGGG TGCGGCGATG TCGGTGGCCT CCACGGCGAT CATCGGCAAC 
GCGCCCGCCA GCCGCGCCGG GATGGCCTCC TCGGTGGAGG AGGTCTCCTA CGAGTTCGGC 
AACCTGACCG CGGTGGCCCT GATGGGCAGC CTGGTCACCT TCGTCTACGC GGCCGCCGTC 
CAGCTGCCGC AGGGCGCCCC GGAAGCCGCC GGGAGGAGCC TGGCCGACGC CCTGGCCTCG 
GCCGGGGGCG ACGACGCGGT GGTCGCCGCG GCCCACGCCG CCTTCGACAC CGGCTACCTG 
GTGGTCATGG TCGTGGTCGC GGCGGTCCTG GCGTGCGGCG CGGCCCTCAC CTGGCGGCTG 
CTGCGCCACC ATGGTCCCGG CACGTCCTCG TCGGCGTACG CGGACCACTG A

Protein sequence

MTATRRWLLL VTVAAGLLLV TVDNTILYTA LPTLTAQLGA TGAQSLWIIN AYPVVMAGLL 
LGSGTLGDRI GHVRMFVVGL VVFGLASLVA AFSPTAWVLI ASRALLAVGA AAMMPATLAL 
IRIAFPIERE RNIAIAVWGS VSVVGGALGP IVGGVLLEFF WWGSVFLLNV PVVIAALVAT 
ALIAPPNVPD PGKHWDLVSS LQAMAGLVAS VLAIKELAHT PPRWPLFAAA VVVAVVAFVL 
FTRRQRRLED PLLDFGVFRN PAFTSGVLAA AFSMFAIGGI QLVTTQRFQL VVGFTPLEAG 
LLVAAVAAGS LPTALLGGAF LHRTGLLPLI AGGLAAGVAG VVVSLLGFQT GIGWLVAGLL 
LTGAGLGAAM SVASTAIIGN APASRAGMAS SVEEVSYEFG NLTAVALMGS LVTFVYAAAV 
QLPQGAPEAA GRSLADALAS AGGDDAVVAA AHAAFDTGYL VVMVVVAAVL ACGAALTWRL 
LRHHGPGTSS SAYADH