Gene Ndas_1423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1423
Symbol
ID	9245273
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1744587
End bp	1745873
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	74%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003679361
Protein GI	297560387
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCG GACCAGCCCC CCGCACCCCC GTGACGAGCG GCCCCGCCGC AGGCCGGACC 
GCCCCGAGCC GTCCACCGCG CGCGGCACTG CTGCTGCTCG CCGCCGGAAT CGCCCTGGCG 
GCCCTGAACC TGCGCACCGC CATCACCAGC GTCGGCCCCG TGCTCGACGA GGTCACCGCC 
GGGCTGGGCA TGACCGCCGT CGGCGCGGGG ATCCTCACCA CCCTGCCCGT GCTGTGCTTC 
GCGCTCTTCG GCGGCCTGAC CCCCGTCCTG GGCCGCCGCC TGGGCGAGCA CCACCTGCTG 
GTCTACGCGC TCATCGCCCT CACCGTCGGC CTCGCCGCCC GGGCCGCGGC CCCCGAGCCG 
TGGATGTTCC TGGCCCTGAG CGTGGTGGCC CTGTCCGGCG GCGCGGTCGG CAACGTCATC 
CTGCCCGCCC TGGTCAAGGA GCACTTCCCC GACCGCGTGG GCCTCATGAC CACCGTGTAC 
ACCACCGGCC TGGCGCTGGG CACCACCATC GCCGCCGCGG CCACCGTGCC CCTGGAGCAG 
TCCACCGGCG AGTGGCGCGC GGCCCTGGGC GCCTACGCCC TCTTCGGCGT CGTGGCCGCC 
GTCCCCTGGC TGCTGGTGCT GCGCCACGAG CCCGCGCGCG GCGACGCCTC CCAGGCACTG 
GGCTTCGGCC AGGTGCTGCG CACCGGCCTG GGCTGGCAGT CCGTCCTCTA CTTCGGCACC 
CAGTCCTCGG TCGCCTACAT CATGTTCGGC TGGTACGCGC AGATGCTGCG CGACCAGGGC 
ATGGACGCCC AGACCGCGGG CCTGGCGCTG TCCTACCTCA CCGTCCTGGG CATCCCCATG 
TCCCTGGTAC TGCCCACGCT GCTGACCCGG ACCAGCGACC AGCGCCCCTT CGTGCTGGCC 
TTCTCCGCCG CCTACCTCGT GGGCCTGGTC GGGCTGTGGT TCGCCCCGCT GTCGGGGGTG 
TGGGCCTGGA CCACACTCGT GGGGATCGGC ATGGGCAGCT TCGTCTTCGC GCTGACCGCC 
TTCGCGCTGC GCACCCGCAC CGGGGCGGGG ACGGCGGCGC TCTCGGCCGT CAGCCAGAGC 
CTGGGCTACC TCATGGGCGG GGCGGGGCCC TTCCTGTTCG GACTGCTGCG CGAGGTCAGC 
GGCGGCTGGC ACGCGCCCCT GCTCCTGCTG GCGGTGCTGG TCGTGGTCAA CCTGGCCACG 
GGCCTGTTCC TGGGCCGTCC CCGCTACCTG GAGGACGCCA TCGCCGCCCG CGGCCTCACG 
AGGGCAGCCA GTCCAGACGG CCGATGA

Protein sequence

MSAGPAPRTP VTSGPAAGRT APSRPPRAAL LLLAAGIALA ALNLRTAITS VGPVLDEVTA 
GLGMTAVGAG ILTTLPVLCF ALFGGLTPVL GRRLGEHHLL VYALIALTVG LAARAAAPEP 
WMFLALSVVA LSGGAVGNVI LPALVKEHFP DRVGLMTTVY TTGLALGTTI AAAATVPLEQ 
STGEWRAALG AYALFGVVAA VPWLLVLRHE PARGDASQAL GFGQVLRTGL GWQSVLYFGT 
QSSVAYIMFG WYAQMLRDQG MDAQTAGLAL SYLTVLGIPM SLVLPTLLTR TSDQRPFVLA 
FSAAYLVGLV GLWFAPLSGV WAWTTLVGIG MGSFVFALTA FALRTRTGAG TAALSAVSQS 
LGYLMGGAGP FLFGLLREVS GGWHAPLLLL AVLVVVNLAT GLFLGRPRYL EDAIAARGLT 
RAASPDGR