Gene Mlg_2747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2747
Symbol
ID	4270216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	3116575
End bp	3117795
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	72%
IMG OID	638127509
Product	major facilitator transporter
Protein accession	YP_743577
Protein GI	114321894
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTGCCC GGACCGCCGC CAAGACGCCG CTCAACGCCG CCGAACGCCG TGCCGCCATG 
GGTCTGGCCG GGGTCTTTGG CCTGCGCATG TTCGGCCTGT TCCTGATCCT GCCGGTCTTC 
GCCCTTTATG CCCCCGGCCT GGAGGGGGCG ACCCCGCTGT TGATCGGCCT GGCTCTGGGT 
GTCTACGGGC TCACCCAGGC CTGTCTCCAG ATCCCCATGG GCATGGCCTC CGACCGCTGG 
GGCCGGAAAC CGGTGATTGC GGCCGGACTG GTGGTATTCG CCATCGGTAG CGTGGTGGCG 
GCCACGGCGG ATGGCATCTG GGGGGTGATC CTGGGGCGGG CCCTGCAGGG GGGCGGGGCC 
ATCGCCGCGG CGGTGATGGC ACTGGCCGCC GATGTCACCC GCGAGACCCA CCGGGCGCGC 
GCCTTTGCCG CCATCGGCAT GAGCGTGGGG CTGGCCTTCC TGCTGGCGCT GATGGTGGCG 
CCCCCGCTCA CCGCCCTAGG CGGGCTGCAG GGGTTGTTCT GGCTCACCGC GGGGGCCTCG 
CTGGTGGGGC TGGTGATTGT CGCCCGCATG CCCCGCCCGG CGCGACCCGC CCAGTCGGCG 
GTCTCCGGCA GCCTGCGGCG CAGCCTCACC GACCCGGACC TGATGCGCCT GAACGTGGGC 
ATCTTCGTGC TGCACGCGGC GCTCACCGGC ATCTTTGTGG CCCTGCCATT GCTCATCCAG 
GCCCGCTTCG GACTGGAGGC GGCCCAGCAC TGGCGGGTCT GGGTGCCGCT GCTGATCACC 
TCGGTGGCGG GCATGCTGCC GCTGCTCATC ATCGCCGAGC GCCGCGGCGC CATGCACCGG 
CTGATCCCGC TGGCGGTTAC CGCCATGGCC CTGGGGCTGA TGGGCCTGGG GCTGCTGATG 
GCCGCGCCGG TCGCGGTCTG GTTGGTGGCC TTATGGCTTT ACTTCGTCAG CTTCAATCTA 
CTGGAGGCCG CGATGCCTTC GCTGGTGTCC CGCTTCGCGC CCGGCGAGGC CCGCGGCGCG 
GCCATGGGGG TGTATGCCTC GGCCCAGTTT CTGGGGGCCT TTGCCGGCGG CCTGTTCGGC 
GGGATCCTGG CCGGGGCCTT CGGGCCGGTG GGGGTGATGC TGGGGTGTGC TGCCATGGTG 
TCGCTCTGGG CCTTGCTGGC GCGGGGCCAG CGGGCGCCGT TGCCGGTGGG CACGCCCCGC 
GCTTCAGAGG GTTCCGGCTG A

Protein sequence

MSARTAAKTP LNAAERRAAM GLAGVFGLRM FGLFLILPVF ALYAPGLEGA TPLLIGLALG 
VYGLTQACLQ IPMGMASDRW GRKPVIAAGL VVFAIGSVVA ATADGIWGVI LGRALQGGGA 
IAAAVMALAA DVTRETHRAR AFAAIGMSVG LAFLLALMVA PPLTALGGLQ GLFWLTAGAS 
LVGLVIVARM PRPARPAQSA VSGSLRRSLT DPDLMRLNVG IFVLHAALTG IFVALPLLIQ 
ARFGLEAAQH WRVWVPLLIT SVAGMLPLLI IAERRGAMHR LIPLAVTAMA LGLMGLGLLM 
AAPVAVWLVA LWLYFVSFNL LEAAMPSLVS RFAPGEARGA AMGVYASAQF LGAFAGGLFG 
GILAGAFGPV GVMLGCAAMV SLWALLARGQ RAPLPVGTPR ASEGSG