Gene Amir_6047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_6047
Symbol
ID	8330257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	7098670
End bp	7100217
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	76%
IMG OID	644946480
Product	major facilitator superfamily MFS_1
Protein accession	YP_003103700
Protein GI	256380040
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGACGGG TGACCCCACG TGACACCCGA CCCGACGGCG ACCCCCACGA CCTCCCCGCC 
ACCGCCCTCG GGGCCGCCGC CGACGCGAGC GCCGCCGCGC GCGGGTCCGC AGGACCGGGT 
GCCGCCTCCG CGACCACCAC CGGGGCCTCC GAGGACGCCA CCGAGGACGC CACCGGGGCC 
GCCACCGGGG CCAAGTCCGC CGCCACCACC ACCGAACCCG GTCTGTGGGC CCCCGAGAAC 
CGGGGCCCCG TCACCGGCAT GGTCCTGCTG ATCACCCTGC TCGCGTTCGA GGCCATGGGC 
GTCAGCACCG CGATGCCCCG CATGGTCGCC GACCTCGACG GCCAGGCGTT CTACTCGTGG 
CCGTTCCTCG GGTTCCAGGC CGCCAGCGTC GTCGCGGTCG TGCTGTCCGG CCGGGTCTGC 
GACCGGATCG GCCCGCGCCT GCCGCTGCTC GTCGGCCCCG CCCTGTTCGT CGTCGGGCTC 
GCCGTCGCCG GGATCGCCCA GGACATGACC CTGCTGATGG CCGGTCGGGT GCTCCAGGGC 
CTCGGCGCGG GCGCCCAGAT CGTGGCCGTC TACGTCCTGA TCGGCCTGGT CTACCCGGAG 
CGGCTGCGGC CCGCCGTGTT CGGCGCGCTG TCCGCCGCCT GGGTGGTGCC CTCGCTCGTC 
GGGCCCGCCG TCGCGGGCTG GCTCACCGAG AACCTGAGCT GGCGGTGGGT GTTCCTCGGC 
CTGGTCCCGC TGGTCGCGAT CGGGTTCGCG CTGGTCCTGC CGGTGCTGCG CGCGCTGCCG 
CCGCACCGGG GCGAGGAGCC CGCCCGCCGA GGGCTGCCGC TGGCCGCGTT CGGCGCGGGC 
GGCGGCGTCG CCGGGCTCAG CTGGGCCGCG CAGCACCCCG GCTGGGCCAG CCTCGCGCTC 
GGCGCCGCCT CGCTGGCCGT GCTGGCGCCG TCGCTGCGCG TCCTGCTGCC CAAGGGCACG 
CTCACCGCCC GGCGCGGCCT GCCCGTCACG ATCCTGGCCA GGGGCCTGCT CGCGGGCACG 
TTCTTCGCCG TCGAGGCGTT CATCCCGCTC ACCCTGACCA CCGTGCACGG CTACTCGGCC 
ACCGCCGCGG GCATCCCGCT CACGCTCAGC GCCATCGGCT GGTCCGCCGC GTCCATGTGG 
CAGTCCCGCC GCCCGGACAT CCCGCGCGAG ACCCTGGTGC GCTGGGGCTT CACCGTCAGC 
GCCACAGGCA TCGCCTCCGT GACCCTCATC GCACCGAGCT GGGGGCCCGC GTGGCTGACC 
TCCGTGCTGT GGGGCGTCGC CGGGCTCGGG GTCGGCATGG CCATGTCCAG CCTGAGCGTG 
CTCACCCTCG CCGCGTCCAC CGACTCCGAC CGGGGCTTCA ACTCCTCGGC CCTGCAGGTG 
AGCGACATGC TCGGTTCGGC CCTGCTGGTC GGCCTCGGCG GCGTCGTGCT CGCCGCCGCA 
CCGGACCTGA CCACCGCCGT CATCCCCCTG GACCTGCTCA TGGCCGGTCT CGCGGTGCTC 
GGTGCCGTGC TCACCGGACC GCGCTGCCGG GCTACCCTGG ACGACTGA

Protein sequence

MGRVTPRDTR PDGDPHDLPA TALGAAADAS AAARGSAGPG AASATTTGAS EDATEDATGA 
ATGAKSAATT TEPGLWAPEN RGPVTGMVLL ITLLAFEAMG VSTAMPRMVA DLDGQAFYSW 
PFLGFQAASV VAVVLSGRVC DRIGPRLPLL VGPALFVVGL AVAGIAQDMT LLMAGRVLQG 
LGAGAQIVAV YVLIGLVYPE RLRPAVFGAL SAAWVVPSLV GPAVAGWLTE NLSWRWVFLG 
LVPLVAIGFA LVLPVLRALP PHRGEEPARR GLPLAAFGAG GGVAGLSWAA QHPGWASLAL 
GAASLAVLAP SLRVLLPKGT LTARRGLPVT ILARGLLAGT FFAVEAFIPL TLTTVHGYSA 
TAAGIPLTLS AIGWSAASMW QSRRPDIPRE TLVRWGFTVS ATGIASVTLI APSWGPAWLT 
SVLWGVAGLG VGMAMSSLSV LTLAASTDSD RGFNSSALQV SDMLGSALLV GLGGVVLAAA 
PDLTTAVIPL DLLMAGLAVL GAVLTGPRCR ATLDD