Gene Mlg_2183 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2183
Symbol
ID	4270962
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2482184
End bp	2483407
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	74%
IMG OID	638126939
Product	major facilitator transporter
Protein accession	YP_743015
Protein GI	114321332
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.362785
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.176029
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCCCT TGCCTCGATT CCTCCAGCCA CGGCCTGAAC TGGCCGCCTT TGCGCTATTG 
GCCACGGCCA CCTCCGGCTT TGGCCAAACC TTCCTGATGT CGGTTTTCGG CGGCGAGATT 
CGCGCGGCCT TCGACCTCAG CCACAGCGCC TACGGCACGC TCTACGGCGC CGCTACCCTG 
GTCAGCGCCC TGCTGCTGCT ACGGGCCGGG GCCTGGGTGG ACCACTGGCC GTTGCGCCGG 
GCGGTGGCGG TGACCCTGCT GTTGCTGGCA CTGGGCTGCC TGACCGTGGG ACTGGCCCCC 
ACGGCGGCGT TACTGCTCCC AGGTTTCCTT CTCATCCGCT TCGCCGGCCA GGGGCTCAGC 
GCCCACCTGG GCCTGACCGC CGCCGGGCGC TATTTCTCCA CCCACCGCGG CAAGGTCATG 
GCCCTGGCGG CCAGCGGCTT TCCCCTCGCC GAGGCCCTGT TGCCGGCAGC GGCAGTGGCC 
ATTATGGGGC TCGGGGGCTG GCGCATGCCC TGGCTCCTGG GCGCGGGTTT CCTGCTGCTC 
TGCATGCTGC CGCTGCTGCT GCGGCTCACC TGGCACGCCC CCAGTGCGGC GGAGGCCGCT 
CGGGAGGCGG GCGGCACCGA CAACGGCCAT CGCCGGCGAG ACGCTCTGCG GGATCCGGGC 
TTCTACCTGC TGCTGCCGGC GGTGCTCGCC GCCCCGTTCA TCGTCACCGC CATGCTCTTC 
CACCAGGCTG CCATCGCCGA GGCCCGGGAA TGGCCGCTGC CCCTCATGGG CGCCGCCTTC 
ACCGGCTTCG CCGCCGGCCA CCTGGCCAGC CTGCTGCTGG CCGGCCCACT GGTGGACCGC 
ATCGGCGCCC ACCGGGCCCT GCCCCTGGCC CTGGGGCCCA TCGGCCTCGG CCTGTTGATC 
CTGGCCTTCG GCGGCGGTGG CGGGTGGGTG CCCTTCGCCT ACCTGACACT CACCGGCGCA 
ACGCTGGGCT GGGGCGCCAC CGCCGGCGGC GCCATCTGGG CCGAGCGCTA TGGCGTGCGC 
CACCTGGGCG CCATCCGGGC CATGGCCCAC GGGGTAATGG TGGCCAGCAC CGCGATCGCC 
CCGGTGGTGG CCGGGGTGCT GCTGGACCGG GGCTGGTCGG TGACCGCCCT GGCGGGTGCG 
ATGGTGGGTT ACGTGCTGGT GGCCGGCCTC TGCGCCCGGG CGGCCCCGGC ACCGCCAGCG 
ATGCGAGCCC CCGCCGGCGG CTGA

Protein sequence

MLPLPRFLQP RPELAAFALL ATATSGFGQT FLMSVFGGEI RAAFDLSHSA YGTLYGAATL 
VSALLLLRAG AWVDHWPLRR AVAVTLLLLA LGCLTVGLAP TAALLLPGFL LIRFAGQGLS 
AHLGLTAAGR YFSTHRGKVM ALAASGFPLA EALLPAAAVA IMGLGGWRMP WLLGAGFLLL 
CMLPLLLRLT WHAPSAAEAA REAGGTDNGH RRRDALRDPG FYLLLPAVLA APFIVTAMLF 
HQAAIAEARE WPLPLMGAAF TGFAAGHLAS LLLAGPLVDR IGAHRALPLA LGPIGLGLLI 
LAFGGGGGWV PFAYLTLTGA TLGWGATAGG AIWAERYGVR HLGAIRAMAH GVMVASTAIA 
PVVAGVLLDR GWSVTALAGA MVGYVLVAGL CARAAPAPPA MRAPAGG