Gene Mlg_0747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0747
Symbol
ID	4270508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	830129
End bp	831280
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	65%
IMG OID	638125496
Product	major facilitator transporter
Protein accession	YP_741591
Protein GI	114319908
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGTATCC CCCAGTTACT GATTGCTGTC TATTGTACCC TGCTGGCCTT CTCCGCCATT 
TACGCCCCGC AGCCGCTGCT GCCGGTGCTG CAGGGGGCGT TTGACGTCAG TGAGACCCGG 
GCCTCGCTGC TCATTACCGT GACCCTGCTG CCCCTGGCCA TCGCCCCGGT GGCCTACGGC 
TTCGTCCTCC AGCGGTTCTC GGCCAAGCGC CTGCTGATCG GCGCCACCGC CCTGCTGGCG 
GTCACCGAGT ACCTGATCTT CTTCGTCACC CACTTCGAGC TGTTCCTGTT CCTGCGGCTG 
CTGCAGGGCC TGCTGATCCC GGCCATCCTC ACCGCGCTCA TGACCTATCT CTCGGCCAGC 
GCCGGACCGG GTCGCATCGC CCGGGTGATG GCCTTTTACG TGGCGGCGAC GGTGCTGGGC 
GGGTTCCTCG GCCGGGCGCT GTCCGGTCTG ATCTCCACCG GCTTTGGCTG GCGCTGGTCG 
TTCCTATTCC TGGGGCTCGC CCTGACCGTC TGCGTGCTGC TGCTGCGACG GCTGGACGCC 
GACCCGCCGG TCAGTTTTCA GAAGCTGCGT GCGGGGACGG TGGTGGCGGT ATTGCGTCAG 
CCCAGTTTCC TGCGGCTGTA CGGGGTGATC TTCTGCGCCT TCTACGTCTT CGCCTCATTG 
CTGAACTTCC TGCCCTTCCG CCTGGTGGAG CTGGGCAGTG GCATGAACGA GACCGGGATC 
GCCCTGATGT ACTCCGGCTA CCTCATGGGC GTGGTCACCT CGCTGCTCTC CCTGCGGATC 
GCGGGGCGCA TCGGCGGGCC GGTCAACACC ATGCTGCTGG GGACAGTGAT CTTCGCCGGC 
TCCCTGCTCT TCTTCCTGGG GCATTCGCTG TGGCTGATCT TCGCCGGCAT GTTTGTCTTC 
TGCGGAGGCA TGTTTCTCAT CCATTCGCTG GCCCCCGGTT TTCTCAACCA GCGGGCTGGG 
GAACAGCGGG GCGTGGTGAA TGGCCTCTAT ATCGCCTTCT ATTATGCGGG TGGCACAGTG 
GGCTCCTTCA TACCCGGCTT CATTTACCAC AGCCTCGGCT GGGCGGCCTA CCTGGCATCG 
CTGGCGGCGG TACTGGCCCT GGCGGGCTAT TGGCTGACAG GATTGCGCCG ACAGACGGTG 
CCGGCGAACT GA

Protein sequence

MRIPQLLIAV YCTLLAFSAI YAPQPLLPVL QGAFDVSETR ASLLITVTLL PLAIAPVAYG 
FVLQRFSAKR LLIGATALLA VTEYLIFFVT HFELFLFLRL LQGLLIPAIL TALMTYLSAS 
AGPGRIARVM AFYVAATVLG GFLGRALSGL ISTGFGWRWS FLFLGLALTV CVLLLRRLDA 
DPPVSFQKLR AGTVVAVLRQ PSFLRLYGVI FCAFYVFASL LNFLPFRLVE LGSGMNETGI 
ALMYSGYLMG VVTSLLSLRI AGRIGGPVNT MLLGTVIFAG SLLFFLGHSL WLIFAGMFVF 
CGGMFLIHSL APGFLNQRAG EQRGVVNGLY IAFYYAGGTV GSFIPGFIYH SLGWAAYLAS 
LAAVLALAGY WLTGLRRQTV PAN