Gene Amir_2119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_2119
Symbol
ID	8326308
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	2344618
End bp	2345778
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	72%
IMG OID	644942669
Product	major facilitator superfamily MFS_1
Protein accession	YP_003099910
Protein GI	256376250
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATGCGGC TGTACCTGCT GTGCGCGGGC CTGGCCAGAC TCGCCGACGA GATGGTGGCC 
GTGACCCTGG TGCTGCTAGC ACTGGAGCGA ACCGGCAGCT CAGCACTATC CGGCCTGGTA 
GTCGCCGCGT ACACGATCCC GTCGGTGGTA TCAGGCCCAC TGCTGGGCGC GTGGCTGGAC 
CGCACCGCGC ACCCCGTGGC CACCCTGGCA GGCAACCAGT TCGCACTGGC CGCCTCAACT 
CTGGCCATGG CACTCCTGCC GAGCACGCCC GCACTGGCGC TCTCGGCGTT CCTGGCAGGC 
TTGGCCCTCC CCCTGACCAG CGGCGGCTTC ACCAGCCTCG TCCCCAGACT GACCACCAAC 
CTCTCCCGCT CGACCTCGGA CGACGCACTG CTGTTCACCG CCGCAGCCAT CGGCGGCCCG 
GCACTGGCCG GCGTGCTGGC CGCGACGAGC GGACCGGTGA CCGCGGCGCT GGTGATCGCG 
GCACTGGCCC TGGCAGGCGG CCTGTGCACG CTCTGGCTGC GCGTCCCCCC ACACCCACCA 
GGCGACCACC CGCCCCTGTT CGTCGCGCTG CGCCGGGGCC TGCGCCACCT GGCGGTGACC 
CCACCGTTGC GCGGCACGAC GATCGCCTCG GCACTGGGGT ACGGCGCGGC AGGCCTGCTG 
GCAACAGCAC TCCCAGCACG CCTGACCGAA CTGGACGGCA CCCCGCACCG CCTGGGCCTG 
CTCCTAGCCG TGCTGGAGAC CGGATGCGCA GTCGGCCTCC TGGCACTGCG CCGACGCCTG 
GACCGCTGGC CCCCGGAACG CGTAGTGCTC ACAGCACTGC CCCTCTACGG CGCAGCCCTG 
GCCACCTGGC CACTGGCGAG CACCACTTGG GCCCTGGTGG CCCTGGTGGC ACTCACCGGC 
TTGGTGGACG CCCCCATCCT CCCGGCGACG ATCAGCGCCA GGCAGCGCTA CACCCCACCC 
ACCCTGCTGG GCCAGCTCTC CACGACAGGC GCAAGCCTGA AGATCGGCAC GTACGCACTG 
GGCGCCGCAG CAGGCGGCCC CCTGCTGTCG ACGTGGCCCC CGTCAGGGGT GATCTGGCTG 
GCCGCCGCAG GGCAGGTGAT CGCTGCGACG GTCGGAGCAG CCGCCACTAC GAACCGGAAA 
ACCCTTCGGG TGACGCCCTA G

Protein sequence

MMRLYLLCAG LARLADEMVA VTLVLLALER TGSSALSGLV VAAYTIPSVV SGPLLGAWLD 
RTAHPVATLA GNQFALAAST LAMALLPSTP ALALSAFLAG LALPLTSGGF TSLVPRLTTN 
LSRSTSDDAL LFTAAAIGGP ALAGVLAATS GPVTAALVIA ALALAGGLCT LWLRVPPHPP 
GDHPPLFVAL RRGLRHLAVT PPLRGTTIAS ALGYGAAGLL ATALPARLTE LDGTPHRLGL 
LLAVLETGCA VGLLALRRRL DRWPPERVVL TALPLYGAAL ATWPLASTTW ALVALVALTG 
LVDAPILPAT ISARQRYTPP TLLGQLSTTG ASLKIGTYAL GAAAGGPLLS TWPPSGVIWL 
AAAGQVIAAT VGAAATTNRK TLRVTP