Gene Namu_0537 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_0537
Symbol
ID	8446120
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	596164
End bp	597738
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	73%
IMG OID	645039671
Product	major facilitator superfamily MFS_1
Protein accession	YP_003199943
Protein GI	258650787
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCGA CCCTGCACCC GATCGCCACC TCGGCGACCG GCGCACCGGT CACCCTTTCG 
ACGACCCCGT CGGCCGGGCC CCGCGCCGGC GTCCGCGAGT GGATCGCCCT GGCGGTCCTG 
ATGCTGCCGG TGCTGCTGGT CGCCGTGGAC GCCACCGTGC TCAGCTTCGC CCTGCCCTCG 
ATCTCGCAGT CGCTGACCCC GACCGGCACC CAACTGCTGT GGATGGTCGA CATCTACCCG 
CTGGTGCTGG CCGGCCTGCT GGTCTCCATG GGCAGCCTGG CCGACCGCAT CGGTCGGCGC 
CGGCTGCTGC TGATCGGCGC CGTCGGCTTC GCCGCCGTCT CGGCCCTGGC CGCCTACGCC 
CCCAGCGCGC AGTGGCTGAT CGCCGCCCGC GCCGCCCTGG GCTTCTTCGG CGCCATGCTG 
ATGCCGGCGA CCCTGTCGCT GCTGCGCAAC CTGTTCGTCG ACCGGCAACA GCGCCGGCTG 
GCCATCGCGA TCTGGGCGGC CGGGTTCTCC GGTGGCGCCG CGCTCGGCCC CATCGTCGGC 
GGGTTCCTAC TGGAGCACTA CTGGTGGGGT TCGGCCTTCC TGATGGCCGT GCCCGTCCTG 
GTCCTGCTGC TGATCCTGGC GCCGATCTTC GTGCCCGAGT CCAAGGACCC GAACCCGGGC 
CGGCTGGACC TGGTCAGCAT CGCGCTGTCG CTGCTGACCA TGGCCCCGCT GGTCTACGCG 
ATCAAGGCGG TCGCGCACGA CGGCATCTCG ACCCTGGCCA TCGGCCTGGT CGCGGTCGGC 
CTGCTGGCCG GCTCGGCATT CGTGCGCCGG CAGCTGACCC GCCCGAACCC GATGCTGGAC 
GTGCGATTGT TCCGGCGCAG CGCCTTCACC GGCGCGGTGC TGGCCAACCT GCTGGCCGTG 
TTCGCGCTGG TCGGGTTCCT GTTCTTCGTC GCACAGCACC TGCAGCTGGT GCTGGGCCAC 
AGCCCGATGC AGGCCGGCCT GATCCTGCTG CCCGGCCTGA TCGTGACCAT CGTCGCCGGG 
CTGGCCGTGG TGCCGCTGGT GCGAGTGGTG CCACCGCGGG TGGTGGTAGC CGGCGGCCTG 
TTGATCAGCG CCGCGGGCTA CACGGCGATC CTGTTCACCG CGAACGACCC CAGCGCGTTC 
GGGTTGGGCG CCGCATTCGT GCTGCTCAGC CTGGGCATCG GGGCCGCGGA GACGATCTCC 
AACGACGTGA TCGTCTCCAG CGTGCCGGCC GACAAGGCCG GCGCCGCCTC GGCCATCTCG 
GAGACCGCCT ACGAGCTGGG CGCGGTGCTG GGCACCGCGG TCCTGGGCGG CATCCTGTCC 
GCGGTCTACA GCGCCCGGGT CGTCGTCCCG GCCGGTCTGG ACGCGGCCGC CGCGACCAGC 
GCGTCGGAAA CCCTCGGCGG GGCGACCACG GTCGCCGCCA CCTTGCCCGA GCCGGCCGCC 
ACCGAGTTGC TCGACTCGGC CCGGCACGCC TTTGACGGCG GTGTCGTGCT GACGTCGGGT 
ATCGCGGTGG TCCTGGTCCT CGCGGCCGCC GCCCTGGTCT GGGTGACGCT GCGCGGCAAG 
GGCGCCGAAA GCTGA

Protein sequence

MTSTLHPIAT SATGAPVTLS TTPSAGPRAG VREWIALAVL MLPVLLVAVD ATVLSFALPS 
ISQSLTPTGT QLLWMVDIYP LVLAGLLVSM GSLADRIGRR RLLLIGAVGF AAVSALAAYA 
PSAQWLIAAR AALGFFGAML MPATLSLLRN LFVDRQQRRL AIAIWAAGFS GGAALGPIVG 
GFLLEHYWWG SAFLMAVPVL VLLLILAPIF VPESKDPNPG RLDLVSIALS LLTMAPLVYA 
IKAVAHDGIS TLAIGLVAVG LLAGSAFVRR QLTRPNPMLD VRLFRRSAFT GAVLANLLAV 
FALVGFLFFV AQHLQLVLGH SPMQAGLILL PGLIVTIVAG LAVVPLVRVV PPRVVVAGGL 
LISAAGYTAI LFTANDPSAF GLGAAFVLLS LGIGAAETIS NDVIVSSVPA DKAGAASAIS 
ETAYELGAVL GTAVLGGILS AVYSARVVVP AGLDAAAATS ASETLGGATT VAATLPEPAA 
TELLDSARHA FDGGVVLTSG IAVVLVLAAA ALVWVTLRGK GAES