Gene Amir_4491 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_4491
Symbol
ID	8328688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	5321478
End bp	5322749
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	71%
IMG OID	644944948
Product	major facilitator superfamily MFS_1
Protein accession	YP_003102181
Protein GI	256378521
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.783622
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGGC AGACCGGACT GCTCCGGCGG GCGAACTTCC GCAACCTGTG GCTCGGCCAG 
ACGCTGTCGA TGTTCGGCGC CGAGATCACC GCGGGCGTGA TCCCGCTGCT CGCGGCGCTG 
ACCCTGGACG CCACCGTGCT CCAGATGGGC GTGCTCTCGG CCGTCACGTT CCTGCCGTAC 
GTGCTGATCA GCCTGTTCGT CGGGGTGTGG CTCGACCGGC TGCCCAAGCG GCGGGTCATC 
GTCGGCGCCG ACCTCGCGCG CGGCCTGCTG CTGCTCCTCA TCCCCCTCGC CAGCGTCCTC 
GGCCTGCTCG ACTTCACGTT CCTGCTGGTC ATCGGGCTGC TCGTCGGGGT GGGGACGGTG 
GTGGCCGACA TCGGCGGCGC CGCGATCCTG CCCGGCGTGG TCGACCGCGC CGACCTGGTC 
GACGGCAACG GCAAGCTGGA GGTCAGCAGC AACGCCTCGC GCATGGCGGG CGAGGCCGTG 
GGCGGCGCGC TCGTGCAGGT GCTCACCGCG CCGTTCGCGC TGCTGTTCAA CACCGCCTCC 
TACCTGGCGT CCGCGCTGTT CACGCTGCGG GTGCGGGTGC GGGAGGAGGA CGTCGAGCCC 
GACGACGAGC TGGAGGACGC CACCAGGGCG GGCTTCTGGG GGGAGATCGG CGAGGGCCTG 
CGCTTCGTCT TCGGCAACCC GATCGTGCGC ACCCTGGCGA TCACGGCCCT GCTGTTCAAC 
CTGTTCACGT TCTTCATCGA GCCGGTGTTC CTGATCTTCA TCACCCGCAC GCTGGGCCTG 
GAGCCGATCT ACATCGGCCT GATCCTGTCC TCGTCGGGCG TGGGCGGCGT GGTCGGCGCG 
CTGGTGTCCG GCCGGGTCTC GCGCAGGCTC CCCCTCGGCA GGCTGCTCGT GCTCACCCAG 
TGGCTGGCGG GCGGCGCGTC GCTGCTCATC CCGGTCGCGA CGCTGGTGCC CAAGCCCGCG 
GCGGTGGTCC TCATCGTGGT CATGCACTTC GTCGACGCGG TCATGGTGAT CGTCTACAAC 
GTCAACCAGC GCAGCTACCG CAGCGCCGTC ACCCCCGACC ACCTCCAGGG CCGGATGAAC 
GCCGCGATCC GCATGATCGT GATGGGGGTG TGCCCGGTGG GCGCGCTGCT GGGCGGCGTG 
GTCGGCGACG TGCTCAGCGC CACGACGGCC CTGGTCATCG GCTCGATCGG CATCCTCAGC 
TCCGGCGCCT ACATCGCCTG CACCCGCATC CGCCACGTCC GCGAGGTCCC CACCGCCGCC 
CCCGACGCCT GA

Protein sequence

MSGQTGLLRR ANFRNLWLGQ TLSMFGAEIT AGVIPLLAAL TLDATVLQMG VLSAVTFLPY 
VLISLFVGVW LDRLPKRRVI VGADLARGLL LLLIPLASVL GLLDFTFLLV IGLLVGVGTV 
VADIGGAAIL PGVVDRADLV DGNGKLEVSS NASRMAGEAV GGALVQVLTA PFALLFNTAS 
YLASALFTLR VRVREEDVEP DDELEDATRA GFWGEIGEGL RFVFGNPIVR TLAITALLFN 
LFTFFIEPVF LIFITRTLGL EPIYIGLILS SSGVGGVVGA LVSGRVSRRL PLGRLLVLTQ 
WLAGGASLLI PVATLVPKPA AVVLIVVMHF VDAVMVIVYN VNQRSYRSAV TPDHLQGRMN 
AAIRMIVMGV CPVGALLGGV VGDVLSATTA LVIGSIGILS SGAYIACTRI RHVREVPTAA 
PDA