Gene Ndas_2663 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2663
Symbol
ID	9246514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3171798
End bp	3173138
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	73%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003680586
Protein GI	297561612
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.11892
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACAGC CCGACCCGGC CCCGGCCGGC GCGAGAGCGC CGAAGGTCAA CGCGGCCGAC 
GCCAGGCGCA TCGCCTTCGC GGCCTTCGTC GGAACAGCCC TGGAGTGGTA CGACTACTTC 
CTGTTCGGCA CGGCCGCCGC TCTGGTCTTC AACCGCCTGT TCTTCACCGA ACTCGACCCG 
GGCGCGGGCC TCATGGCGGC GCTGGCGACC TTCGGCGTGG GCTTCGCCGC CAGGCCCATC 
GGATCCCTGA TCTTCGGCAC CATCGGGGAC CGCTACGGAC GGCGCCCCGC ACTGCTGATG 
ACCATCGTCA TGATCGGCTG CGCGACCGGG CTCATCGGCG TGATCCCCGA CTACATGGCC 
ATCGGGATCG CCGCGCCGAT CCTGCTCGCG GTCCTGCGGC TCCTCCAGGG CCTGGCCGTG 
GGCGGCGAAT GGGGCGGCGC CATCACCATC GCCATCGAGC ACGCCCCCGA GCGCCAGCGC 
GCCCGCTACG CCGCCCTGGT CCAGATCGGC TCCCCGGTCG GCACGCTCAT CTCCTCGGCC 
GCCTTCGCCG CGGTGCTGAC GCTGCCCGCG GCCGACTTCG ACGCCTGGGG GTGGCGCCTG 
CCGTTCCTGG CCGCGTTCCC GCTGCTGGGC ATCGCCCTCT ACATCCGCTT CAAGGTGGAG 
GAGTCCCCCG TCTTCCAGGA GCTGGTGCAG ATGGAGGACC GCGCCAAGGT GCCCGCCCTG 
GCGCTGTTCC GCGAGGCCGG GGGCCGCCTG CTCGTGGCGG TGGCCGCGGC GCTGCTGGGG 
GTCGGCGGCT TCTACGTGAT GACGACCTTC GTGGTCTCCT ACGCCTCCAC GGTGCTGGAG 
GTCGACCGCC AGGCGGTCGT GAACGCCACG CTCGTCGCCG CCGTCTTCCA GATCGCCACG 
ACCCTGGTCG CCGGGCGCGC GGCCGAGCGC TTCGGCCCCG GCCGGATGAC GGTGATCGGC 
GCCCTGGCCA CCGCCGCGGC CGCGTTCCCC CTGTTCCGGC TCATCGACAC CGCCGACCCG 
TGGGCGATCA CCGCCGCGGT GACCATCGGG ATCTGCCTCA TCACCCTGGC CTACGCCGTC 
ACCGGCACCC TGCTGGCCGA CCTCTTCCCG CCCCGGCTGC GCTACAGCGG GGTGTCCCTG 
GGCTACAACC TCGCCGGAAC CCTCAGCGGG TTCCTCCCGC TCATCGCCAC CGCGCTCCTG 
GCCGTGGACG ACGGCGCGTC CTGGCCCGCG GTGCTGGTCC TCATCGGCAT CTGCGCCGTC 
ACCGCGGTCG GCGGCCTGGC CGGTGAGCGG ATCAGGGCCG CGGACACCCG CGCCGCCGCC 
GACACCCGGG CCGCGGCGTG A

Protein sequence

MPQPDPAPAG ARAPKVNAAD ARRIAFAAFV GTALEWYDYF LFGTAAALVF NRLFFTELDP 
GAGLMAALAT FGVGFAARPI GSLIFGTIGD RYGRRPALLM TIVMIGCATG LIGVIPDYMA 
IGIAAPILLA VLRLLQGLAV GGEWGGAITI AIEHAPERQR ARYAALVQIG SPVGTLISSA 
AFAAVLTLPA ADFDAWGWRL PFLAAFPLLG IALYIRFKVE ESPVFQELVQ MEDRAKVPAL 
ALFREAGGRL LVAVAAALLG VGGFYVMTTF VVSYASTVLE VDRQAVVNAT LVAAVFQIAT 
TLVAGRAAER FGPGRMTVIG ALATAAAAFP LFRLIDTADP WAITAAVTIG ICLITLAYAV 
TGTLLADLFP PRLRYSGVSL GYNLAGTLSG FLPLIATALL AVDDGASWPA VLVLIGICAV 
TAVGGLAGER IRAADTRAAA DTRAAA