Gene Mlg_0091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0091
Symbol
ID	4268829
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	100152
End bp	101567
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	70%
IMG OID	638124817
Product	major facilitator transporter
Protein accession	YP_740938
Protein GI	114319255
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGCAGG TTTTTCTCTC GATCCTGGCG CTGCTGGGCT CAGTAGGGCT GTTCACGCTG 
GGCAGCGGGC TGCTGGGCAC CCTGCTCGGC GTGCGTATGA CCCTGGACGG CTTCGACCCG 
CAGGTCACCG GCCTGGTCAT GGCCGCCTTC TTCGTGGGGT TAATGGTGGG GGCCATGGAG 
GCCGGCCGGG TGATCCGCCG GGCCGGGCAC ATCCGAGCCT TTGCCGTCTT CGCCGCCTGC 
GCCACCGCCG CCGTGCTGCT GCACGGGCTG TTCGTCTCGG TATGGGTTTG GGCCCTGCTG 
CGGGTGATCA CCGGCTTCGC CGCCGCTGGC ATCTACATGG TCATCGAGAG CTGGCTCAAC 
GAGCGCTCCT CGGCGGCCAA CCGGGGCCGG GTGTTCTCGG TCTACCAGGT GGTCAGCTAC 
CTGGGCCTCG GCACCGGGCA ATTCCTGCTC TTCGCCGCCG ACCCCGCCAC CACCGAGCTG 
TTCATGATCA CCGCCGGCCT GTTCGCCCTC TGCCTGATCC CGGTGGCCAT GACCCGGGGC 
CTCCACCCCT CGCCGCCGGA AAGCCACGGC ATGGCGCTGA GGCCGGCGCT CACCGAGTCA 
CCGTTGGGGG TGGTGGCCTG CATCGGTGCG GGCATGGTCA ACGGGGCGGT GTTTGCCCTG 
ACCCCGGTCT TCGCCCTGGA GGCCGGACTG GGCCTGGCCG GGGTCTCGCT GCTGATGGGG 
GCGATCATCT TTGGCGGTTT TCTGCTGCAA TGGCCCATCG GCCACCTCTC CGACAACTTC 
GGCCGGCGCG GGGTGATGGC CATCGTCAAC CTCTCGGTGG CGGTGGCGGC GGTGGCCCTG 
GTCTTCTCCG CCGAGCTCAC CCTGCCGGTG CTGATGGGGG TGGGGGCGCT GTTCGGGGGG 
CTCTCCTTCA CCCTCTACCC GTTGGCGGTG GCCCATACCA ACGACCAGAT CAAGGTACGT 
GACTTTGTCA CCATCAGCGC GGCACTGCTG TTCCTGTGGG GGTTGGGATC GGCGGTGGGG 
CCGGTGCTGG CCGGTCAGGT GATGGGCCGG GTCGGCAATA CCGGGCTGTT CCTGTTCGTT 
GCGGTCATCG CCCTGGGCGT GGCCCTGGCC GCCTGGCAAA TGCGTCGCGA GTCAGTGGCC 
CCGGAGGACC AGGAGCCCTT CGTGGTGATG GCCCGGACCA CGCCGGTGGC CTCCGAGCTG 
GACCCGCGCT ACGACGAAGA GGCCGCCCGG GAAGCGGCCG AGCAGCAGGC GCGGGCCGAT 
GCCGAGACCG CCGCCGCCGA ACTCTGGGAC GAGGTGGTGG TTGCCGAGGC GGAGGCGGAA 
GCGGAGGCCG ACGCCGCCAC CAAGCCGACC GCCACCGGGG ACGCCGGCCC CCAGGACGGC 
GACGAGGACA CGACCCCGCC GCCACGCCGC GACTGA

Protein sequence

MAQVFLSILA LLGSVGLFTL GSGLLGTLLG VRMTLDGFDP QVTGLVMAAF FVGLMVGAME 
AGRVIRRAGH IRAFAVFAAC ATAAVLLHGL FVSVWVWALL RVITGFAAAG IYMVIESWLN 
ERSSAANRGR VFSVYQVVSY LGLGTGQFLL FAADPATTEL FMITAGLFAL CLIPVAMTRG 
LHPSPPESHG MALRPALTES PLGVVACIGA GMVNGAVFAL TPVFALEAGL GLAGVSLLMG 
AIIFGGFLLQ WPIGHLSDNF GRRGVMAIVN LSVAVAAVAL VFSAELTLPV LMGVGALFGG 
LSFTLYPLAV AHTNDQIKVR DFVTISAALL FLWGLGSAVG PVLAGQVMGR VGNTGLFLFV 
AVIALGVALA AWQMRRESVA PEDQEPFVVM ARTTPVASEL DPRYDEEAAR EAAEQQARAD 
AETAAAELWD EVVVAEAEAE AEADAATKPT ATGDAGPQDG DEDTTPPPRR D