Gene Ndas_3215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3215
Symbol
ID	9247072
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3845538
End bp	3847022
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	67%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003681129
Protein GI	297562155
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACGAA CGTCGACCGC CGGGCCCGCG ACCAGGGCCC TCATCCCGGT GCTCGCCTTC 
ACGGGCATCG TGGTTTCAGT GATGCAGACC ATGCTCATTC CTCTGATCAA GGATCTGCCG 
CAACTCCTGG GCACCGAGCC TCACAACGCG ACCTGGGTCA TCACCTCGAC GCTTCTCTCA 
GGCGCCGTCG CCACGCCAGT CATGGGACGC CTGGGTGACC TCCACGGCAA GCGCCGCATG 
CTGATCCTCA GCCTCGCGGT GATGGTCGTC GGCGCACTCG TCAGCGCCGT CACCGACGAT 
CCGCTTGTGA TGATCACGGG CCGGGCCCTC CAGGGCTTCG CGATGAGCGC GATACCCCTC 
AGCATCAGCT TGGCGCGTGA CATAGTTCCC CGCGAAGAAC TCGGCTCTGC GATGGCCCTG 
ATCAGCTCCT CCATGGGCGT CGGGGGGAGT CTCGCCCTGC CCGCCTCGGG CTTGGTCGCC 
CAGCACGCCG ACTGGCACGC CCTCTTCTAC GGCGCCGCAG GTCTTGGCCT TTTGTGCATC 
GCGCTGATCC TCATCGTCGT CCCCGAGTCA CCGGTTTCCA CACACGGCAC CTTCGACCTC 
CTGGGCGCGG TCGGCCTGTC CGCCGCCCTC ACCCTCTTCC TGCTGCCGGT CACCAAGGGA 
AGCCACTGGG GCTGGACCTC CAGCACCACC CTCGGACTGT TCACCGCGGC GGTCGTCGTG 
CTCATCTTGT GGGGCGTGCT GGAACTGCGC CTCGACGCAC CGCTGGTGGA CCTGCACACG 
ATGGCCCGTC CCGCGGTGCT TTTCACCAAC CTCGCCTCGA TCATGGTCGG TGCCTCATAC 
CTGGTCGTCT CGATGGTCCT TCCCCAACTG CTCCAGTTGC CGAAGGCCAC CGGATACGGC 
CTCGGCCAGT CAATGGTGAC CGCGGGCCTG TACCTGGCAC CGCTCGGCCT GACCATGATG 
CTCACGGCAC CTATCTACGC GCGGCTGTCC GCGAGGCATG GCCCCAAGAG CACCTTGATC 
CTCGGCATGT CGATCGTTGC GATCGGCTAC GGAGTCGGCC TCAGCCTCAT GAACGCACCC 
TGGCAAAGCC TCATCATCAC GGCGGTCCTG GGTGTGGGCA TCGGTCTCGC CTACTCCTCC 
CTACCCGCCC TGATCGTCGG CGTGGTCCCC GCCACGCAGA CGGGCTCGGC CAACGGCCTC 
AACACGCTGA TGCGCTCGAT CGGCTCCTCG CTCTCCAGCG CCGTCATCGG CGGGATCCTC 
TCCACCACCG CACACCAGTT CAACGGCGTT CCCGTCCCCA GCATGTGCGG CTTCCGCATC 
TCCTTTCTGA TAGCGACAAG CGCAATGGCG ATCGGCCTGT TCACAGCCCT CTTCCTGCCC 
GGGCCCGCCC GGTCGGCCGG GGCACCACAC CGACGGCGGG CAAACCCCCG CCCGGTCGCA 
CACGCGCGGG AAGTGACAGG TGGCCCTGCA TCGACAGGAG AGTGA

Protein sequence

MTRTSTAGPA TRALIPVLAF TGIVVSVMQT MLIPLIKDLP QLLGTEPHNA TWVITSTLLS 
GAVATPVMGR LGDLHGKRRM LILSLAVMVV GALVSAVTDD PLVMITGRAL QGFAMSAIPL 
SISLARDIVP REELGSAMAL ISSSMGVGGS LALPASGLVA QHADWHALFY GAAGLGLLCI 
ALILIVVPES PVSTHGTFDL LGAVGLSAAL TLFLLPVTKG SHWGWTSSTT LGLFTAAVVV 
LILWGVLELR LDAPLVDLHT MARPAVLFTN LASIMVGASY LVVSMVLPQL LQLPKATGYG 
LGQSMVTAGL YLAPLGLTMM LTAPIYARLS ARHGPKSTLI LGMSIVAIGY GVGLSLMNAP 
WQSLIITAVL GVGIGLAYSS LPALIVGVVP ATQTGSANGL NTLMRSIGSS LSSAVIGGIL 
STTAHQFNGV PVPSMCGFRI SFLIATSAMA IGLFTALFLP GPARSAGAPH RRRANPRPVA 
HAREVTGGPA STGE