Gene Amir_4647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_4647
Symbol
ID	8328845
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	5532742
End bp	5533992
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	72%
IMG OID	644945093
Product	major facilitator superfamily MFS_1
Protein accession	YP_003102325
Protein GI	256378665
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGCA CTCCCAGGAT CGCGGGGGGC ATCACCGCGT TCGCGATCTT CGCCACCGCG 
GTCAGCTTCG TGATCTCGAT GGCGGGCTCG TCGATGAAGA GCACCGTGCA GGTGCTGTTC 
CTGCCGATGG TCGACAGCTT CGACGTCACC AGGGGCACCC TGGCGGTGGG CACGACGCTG 
TTCGCGGTGG TCACCGCGCT CGCCTCGTCG GCGGTGGGGC ACCTGGCGGA CCGGATCGGC 
GCGGTGCCGG TGCTGGCGAT GGGCGCCGGG ATCGTCGGGT GCGTGCTGCT GATCTGCGGG 
ACGGTCACCG ACATCCGGCT GTTCGTGCTG GCCTACGGCG TGCTCGGCGC GATCGGCTGC 
ACGATGCTGT CGTTCGTGCC GCTGGGCGTG CTGGCCGACC AGCTGTTCGC GGGGCGCAAC 
GCGGGCGTGC TGTACGCGGT GCTGACCAAC GGCGCGGCGG TCGGCTTCAT GGTGCTGGTG 
CCGCTGTGGA CGTACCTGGG CGGCATCACC GACTGGCGGC AGATCCTGCT GGGCGCGGGC 
GCGGTGTTCC TGGTGGTGCT GCTGCCGCTG TCGCTGCTGC TGGTGCGCTC CTCCACCCGC 
CAGCCCAAGC CGCCCGCCGC GCCCGCCGAG CACGGGTTCC TGGCCGGGGT GCGCACCGCG 
TTCGCCGACC GGCGGGTGCG CGGGCTGATC CTGCCGTTCT TCGCCTGCGG CACCACGATG 
GCGTTCGTCG ACGTGCACCT GTTCCCGCAC ATGCACGACC ACGGCGTGGC CCCGGTGACC 
AGCTCGGTGG CGTTCGTGCT GCTGGGCGCG ACCGAGATCG CCGGGTCGCT GGTGGCGGGC 
AGGCTGTGCG ACCGGGGCCG GATCAGGGCC ACGCTGGTCG GCGGCTACCT GATGCGCGCG 
GGCGCGATGG TGCTGACCCC GTTCTTCTCC GCCGAGTTCA CCGTCCTGGT GTTCGGCGCG 
GTGTTCGGGG CGAGCTACCT GGTGACCGTG GTGGCCACCA CGATGTGGAT CGCGAAGATC 
CTGCCGCGCG GGCGCAAGGG CACCGCGATC GGCGTGCTGT GGGCGCTGCA CATGGTGGCG 
GTGGCGGTGA GCAGCCAGCT GGGCGCGGTG ATCGCGGACC GGTTCCACAG CTACCTGCCG 
GTGATCCTGC TCAGCGCGGT CATGACGGTC GGCGCGGCCC TGCTGGTGTC GCTGCAGCCC 
GACCCGGACG CGGTCGGGCC CGAGGTGAGC CGGACGCCCG CCGCGGCGTG A

Protein sequence

MSGTPRIAGG ITAFAIFATA VSFVISMAGS SMKSTVQVLF LPMVDSFDVT RGTLAVGTTL 
FAVVTALASS AVGHLADRIG AVPVLAMGAG IVGCVLLICG TVTDIRLFVL AYGVLGAIGC 
TMLSFVPLGV LADQLFAGRN AGVLYAVLTN GAAVGFMVLV PLWTYLGGIT DWRQILLGAG 
AVFLVVLLPL SLLLVRSSTR QPKPPAAPAE HGFLAGVRTA FADRRVRGLI LPFFACGTTM 
AFVDVHLFPH MHDHGVAPVT SSVAFVLLGA TEIAGSLVAG RLCDRGRIRA TLVGGYLMRA 
GAMVLTPFFS AEFTVLVFGA VFGASYLVTV VATTMWIAKI LPRGRKGTAI GVLWALHMVA 
VAVSSQLGAV IADRFHSYLP VILLSAVMTV GAALLVSLQP DPDAVGPEVS RTPAAA