Gene Ndas_5360 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5360
Symbol
ID	9249263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	536463
End bp	537755
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	72%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003683246
Protein GI	297564273
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.261806
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCGG AACAGGAACG CCCGTCCCGG TCACCCGGCC GGACCCCGCC GGTCCACAGC 
GCGGAACAGC TCGTCCCCCT CACCCGCAAC CGCGACTTCC AGGTGCTCTG GACCAGCCGG 
TTCCTCGCGG GACTGGGCAA GGAGAGCGGC GAGATCGCCT ACCCCCTCCT CGCCCTCCTC 
CTCGCGGAAT CGGCGGCGCA GGCGGGCGTC ATCGGAGCGG CCCAGGTCAC CACGGCCATG 
GTCACCGCCG TCCTCGGCGG TTCGCTCGCC GACCGGACCA ACCGCCGCAC GGTGCTGCTG 
TGCTGCGACC TCGGACGGCT TACGCTGCTC TCCCTCTTCA CCGTCCTCCT GCTCACCGGG 
AACGTCACGT TCACCGTCAT CGTGGGCGTC GCGGTCGGCT CCGCAGCGCT GATGGGCGTC 
TCCAACCCCG TCGCGATGGC CTCCGTCAAG CAGCTGGTTC CGGCCTCACA GACGGCCGAG 
GCCTCCGCCC AGAACCAGAT CCGCCTCTTC AGCACCACCG CCCTCGGCGG ACCCTTCGCC 
GGAACCCTGT TCGGCGTGGG CCGGGCCTTC CCCTTCGCCG CCGAGGCCCT CGCCTACCTG 
GTGTCGGCGG CCCTGGTGCT GCTCATCCGC CGCCCCATGC AGGCCCACCC GACCGGCGCG 
CGCGGACCGT GGACCCTGCG CGAGGCGGTC AGCGGGTTCA CCGTGCTGGC CAGGCACCCG 
ATCCTGCGGC CGATGATCTT GTGGATCGTC GGGTTCAACC TCACCTACAC CCAGACGGGC 
GCCTTCCTGG CCCTCATCGC CACCGCCCAG AGCCAGGGCG CCAGCCACCT CCAGACCGGG 
ATGACCGTCT CCCTGGCCGG GTCCGGCGGC CTGCTCGGCG CGCTCTGCGC CGGGGCGGTC 
GTCAGGCGGG TGCGGCCCTC GGCCATCTTC CTGGTCGCGG CCTGGGCCGC CCCGGTGTGC 
GCTCTGGGGC TGCTGTTCGC ACCCAACGTG ATGTTCCTCG GGGCGCTGGT GGGCTGCGTG 
TTCGCCATCG TGCCCTGCGT GAACGCCGTG TTCCACGGTT ACGTCGCGGT GTCGGTCAGC 
GACCGCTACC AGGGCCGCGT CCTGGGCGCC GTCACGTTCA TGGCGCTGGT GTCGCAGCCG 
GTGGGCATCC TCGGCATCGG GGTGATCTTC GACCACGCCG GACCCGCCTG GGTGTTCCTG 
ACGATGGCGC TGGTCTCGGC GCTCGCCGCC CTGTTCAGCC TCTCCCCGGT CATGCGCGAC 
CTGCCCCGGC CCGAGGAGGT GGCCGTGGCC TGA

Protein sequence

MTAEQERPSR SPGRTPPVHS AEQLVPLTRN RDFQVLWTSR FLAGLGKESG EIAYPLLALL 
LAESAAQAGV IGAAQVTTAM VTAVLGGSLA DRTNRRTVLL CCDLGRLTLL SLFTVLLLTG 
NVTFTVIVGV AVGSAALMGV SNPVAMASVK QLVPASQTAE ASAQNQIRLF STTALGGPFA 
GTLFGVGRAF PFAAEALAYL VSAALVLLIR RPMQAHPTGA RGPWTLREAV SGFTVLARHP 
ILRPMILWIV GFNLTYTQTG AFLALIATAQ SQGASHLQTG MTVSLAGSGG LLGALCAGAV 
VRRVRPSAIF LVAAWAAPVC ALGLLFAPNV MFLGALVGCV FAIVPCVNAV FHGYVAVSVS 
DRYQGRVLGA VTFMALVSQP VGILGIGVIF DHAGPAWVFL TMALVSALAA LFSLSPVMRD 
LPRPEEVAVA