Gene Ndas_2440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2440
Symbol
ID	9246290
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2893917
End bp	2895191
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	78%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003680366
Protein GI	297561392
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.293743
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCCACC CCCAGCAGAC CGGCACTGTG CCCACGGCCC CACCGCGCGC GCACGTGTTC 
TCGGACCCCG CCTTCCTCCG CCTGTGGTCG GGGAGCACCG CCTCGGGACT GGCCACGTGG 
GCCATGCCGT TCATCCTCGG CCTGGCCGTC CTGGACGGAT CGCTCACCGC CATGGGGCTC 
GGCCTGCTCC TGGCCACCCG TACCGGCGGG TTCCTCCTCG CCCTGCCGCT CGGCGGCCTG 
CTGGCCGACC GGCTCTCCCG CCGCGCGGTG GTGCTGTGGG CCGGGGTCCT CGCGGCGGCG 
GCCACTCCGC TGGTCGCCGC GGGCGTGGCG ACCGGCGCCC TGGCGCTCGC GGCCGTGGCC 
GCGGCGGCCG TGGGCGCGGG CCAGGGAGCC TGTAGACCCG CCTTCCAGGC GCTGACCGCC 
GAGGTCGTGG ACGAGCCGCG GCGCCAGCGC GCCAACGCGG CGCTCACCAT CTCCGTGCGG 
GTCACCACCC TGGTCGCCCC GGGGGCGACG GCGCTGCTCT CCACGGTCCT GGGCGTGCAC 
GCCCTCCTCC TGGTCACCGC CGCGCTCTGG GCGGTCGCCG CCCTGGCCCC GCCCCGGGGC 
CGGAGCGCGC CCGCCCCGGG AGCGGTGCCC GCGCGCGGCT TCTCCCCGGT CGCCGACTTC 
CGCGACGGGC TGCGCGAGGC CCGGCGCCAC ACGTGGTTCC TCGCGGGGCT GGGCGCCCTG 
ACGGCGGTGA TCGCCACCGG GTACTCCGCC ACGGGCGTGC TGCTCCCGGT TGTCAGCCGC 
GACACCTACG GCACCGAGGC GGTGCTGGCG GGCGCGCTGA CCGCCTACAC CGGCGGCGCG 
CTGGCCGGGG CGCTGCTGAT CGGGCGCTGG CGCCCCTCCT CCCAGGGGTG GGTGGCGCTG 
GCGGGCCTGG CCCTGTACGG GCTCGCGCCG CTGAGCCTGC TCCTCCCCGT GGGCCCGTGG 
ACGGTGTTCG CCGCCTACGC CCTGGCGGGG GTCGGGATCG AACTGTTCAA CGTCCCGTGG 
TTCACCGCCG CCCAGCGCGA GGTCGCGCCC GACAAGCTCG CCCGCGTCTC CTCCCTGGAC 
TTCCTGTTCT CCTACGGCCT GGCCCCGGTC GGGCTCGCGC TGATCGCCCC GGCCACCCAG 
GCCTTCGGCA CGGAGGCGGT CCTGGTCGTG TGCGCCGCCC TGTGCTTCCT GGCCCCGGGG 
GCCGCGGCGC TCGCCCCCGG TTCGCGCCAC TTCGCCATGG GAGGCCATGG GGCCCCGGCC 
CCGCGAGCCG CCTGA

Protein sequence

MAHPQQTGTV PTAPPRAHVF SDPAFLRLWS GSTASGLATW AMPFILGLAV LDGSLTAMGL 
GLLLATRTGG FLLALPLGGL LADRLSRRAV VLWAGVLAAA ATPLVAAGVA TGALALAAVA 
AAAVGAGQGA CRPAFQALTA EVVDEPRRQR ANAALTISVR VTTLVAPGAT ALLSTVLGVH 
ALLLVTAALW AVAALAPPRG RSAPAPGAVP ARGFSPVADF RDGLREARRH TWFLAGLGAL 
TAVIATGYSA TGVLLPVVSR DTYGTEAVLA GALTAYTGGA LAGALLIGRW RPSSQGWVAL 
AGLALYGLAP LSLLLPVGPW TVFAAYALAG VGIELFNVPW FTAAQREVAP DKLARVSSLD 
FLFSYGLAPV GLALIAPATQ AFGTEAVLVV CAALCFLAPG AAALAPGSRH FAMGGHGAPA 
PRAA