Gene Ndas_1113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1113
Symbol
ID	9244963
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1366020
End bp	1367786
Gene Length	1767 bp
Protein Length	588 aa
Translation table	11
GC content	74%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003679060
Protein GI	297560086
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.413258
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCCG CCCAGACCGG AAACGGCACC GTCGGCGCGG CGCCCGCCCT CGCGGGCCCG 
CGCGAATGGA CCGCGCTCGC CGTCCTGGTC CTCCCGGTGA TCCTGATCTC GGTCGACTCC 
ACCGTGCTCG GGTTCGCCGT CCCCGCGCTC AGCGAGCAGC TGCGGCCCGA CGCGGGCCAG 
CTGCTGTGGA TCGTCGACGT CTACGGCTTC GTCCTTGCCG GACTGCTGAT CACCATGGGC 
TCGCTCGGCG ACCGCATCGG CCGGCGACGC CTGCTCATGA TCGGTTCGGC CGCCTTCGGC 
GCGGCCTCGC TGCTCGCCGC GTTCTCACCC ACCGCCGAGG TGCTCATCGC GGCCCGCGCC 
CTGCTCGGCC TGGCGGGCGC CTCACTGATG CCCTCGACCC TGTCGCTGCT GCGCAACATC 
TTCCTGGACC CGCGCCAGCG CCTGCTGGCC ATCGCCCTGT GGGCGTCGGG GTTCTCCGGC 
GGCGCGGCGC TCGGCCCGAT CCTGGGCGGC TGGCTCCTGG AGCACTTCTT CTGGGGCTCG 
GTGTTCCTGA TCAACCTGCC GGTGATGGCG CTGATCCTGG TGCTGGTCCC GCTGCTGGTG 
CGCGAGTCGC GCAACCCCGA CTCGGGCCGC CTGGACCCGC TGAGCGTGGT CCTGTCCATG 
GCCGCGATCC TGCCCGTCGT GTACGGCGTC AAGAACCTGG CCACCGAGGG CCTGGCGGTC 
GTCCCGGTCG TCTCCCTGGC GGTCGGCCTG GGCCTGGGCT ACCTGTTCGT CCGGCGCCAG 
AAGGCCCTGG ACGACCCGCT GATCGACGTG GGCCTGTTCC GGTACCGCGT GTTCAGCGTG 
GCGGTGGCCA CCAACCTGAT GATCGTGTTC TCGCTGGTGT CGTCGCTGTT CTTCCTGACG 
CAGTACCTCC AGCTGGTGCT GGGCGTCTCA CCGATGCGGG CCGGTTTCGT GCTGGTGCCG 
GGCCTGGTGC TGTCGGTGCT GGCGGGGCTG GTGGCGGTGC GGCTGTCGCG CCACCTGAGT 
CTGGCCACGG TGATCGGCGG GTCCCTGCTG GTGACCGCGA CGGGGTTTGC GGTCCTGGTC 
TTCGCGCCGC AGGGCAACGT GGTGACCGGT GTGGTGCTCG TGACGGCGGG CTTCGCGCTG 
ATCGCCACCG GCTCCGGGTT CGCTGAGACG CTGACCAACG GCGCGATCAT GGCGGCGGCC 
CCGCCCCAGC GCGCGGGCGC GGCCTCGGCG ATCTCCGAGA CCGCCTACGA GCTGGGCGCG 
GCGCTGGGCG TCGCGCTGCT GGGCAGTGTG CTGACCGCGT CCTACCGGGC GAACCTGACC 
GCCGTGGAGG GCGTGCCCTT GGGGGCTGTG GACGCCGCCC GGGAGACCCT GGGCGGGGCC 
GCGAACGCCG CCGCCGAGGT GGGCGGCGCC GCGGGCGACG CGCTGATGCT CGCCGCGCGG 
ACGGCGTTCA CCGACGGCAT GCACCTGACC AGCGTCATCG CCGTGGTGAT CGTCCTGGCC 
GCCGCCGCGC AGGCGTGGGT GCTGCTGCGC GGTCGGGGCA ACCCGGCGGT GGAGCCGGTG 
GAGGGCCCCG CCGAGGGAGC CCTGGAGGAG ACGGTCGAGG CCGTGGGCAC CGCCGGGACC 
GCGGGGGCCA CGGTGGCCGC CGAGGCCGCG GGCGCCGAGG AGGCCGGAGG GACCACGGGT 
GCCGGGCAGG AGCCCGCTCC GGTGGCCGCC GACCCCGCGG CCGGTGACAC CCAGGCCGCG 
CCGGAGCGGA ACCGCTCCGA CGGCTAG

Protein sequence

MSSAQTGNGT VGAAPALAGP REWTALAVLV LPVILISVDS TVLGFAVPAL SEQLRPDAGQ 
LLWIVDVYGF VLAGLLITMG SLGDRIGRRR LLMIGSAAFG AASLLAAFSP TAEVLIAARA 
LLGLAGASLM PSTLSLLRNI FLDPRQRLLA IALWASGFSG GAALGPILGG WLLEHFFWGS 
VFLINLPVMA LILVLVPLLV RESRNPDSGR LDPLSVVLSM AAILPVVYGV KNLATEGLAV 
VPVVSLAVGL GLGYLFVRRQ KALDDPLIDV GLFRYRVFSV AVATNLMIVF SLVSSLFFLT 
QYLQLVLGVS PMRAGFVLVP GLVLSVLAGL VAVRLSRHLS LATVIGGSLL VTATGFAVLV 
FAPQGNVVTG VVLVTAGFAL IATGSGFAET LTNGAIMAAA PPQRAGAASA ISETAYELGA 
ALGVALLGSV LTASYRANLT AVEGVPLGAV DAARETLGGA ANAAAEVGGA AGDALMLAAR 
TAFTDGMHLT SVIAVVIVLA AAAQAWVLLR GRGNPAVEPV EGPAEGALEE TVEAVGTAGT 
AGATVAAEAA GAEEAGGTTG AGQEPAPVAA DPAAGDTQAA PERNRSDG