Gene Mlg_1044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1044
Symbol
ID	4270517
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1194069
End bp	1195259
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	70%
IMG OID	638125796
Product	major facilitator transporter
Protein accession	YP_741887
Protein GI	114320204
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.122672
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTAAGGA ACCGACTCGC GCGGCATCCG CTGGCCGTCA TTGTCATCGC CCAGCTGTTC 
GGCACCTCGC TTTGGTTCAG TGTCAACGGC GTGGGGCTGG CCCTCAGCGA AGCGGTGGCG 
CTCAGCGACA CCGGCCTGGG CCTGCTCACC ATGGCGGTTC AGGCCGGCTT CATCACCGGC 
ACCCTGATCA TTGCCACCAC GGGGCTCGCC GACCGGGTGC GGGCAAGCCG GCTGTTCGCC 
ATTGCGGCGG TGACCGGCGC GGTGATCAAC GCCGGCTTCA TCCTGGTGGC GGGTGATCTC 
CACCTGGGGG TGACAGCCCG CTTTCTCACC GGCCTGTGCC TGGCGGGGAT CTATCCCCTG 
GGTATGAAAC TGGTAGTCAG TTGGACGCCC CGCTACGCCG GCGCGGCGCT GGGCTGGCTG 
GTGGGCATGC TGACCCTGGG CACCGCCCTG CCTCACCTGC TGCGCGGGGC CACCTTCGAA 
CTGCCCTGGC AGTGGCCGCT GCTGCTGGCC TCCGGCCTGG CGCTGGTGGC GGCCTGGCTC 
ATCCATTCCC TCGGTGATGG CCCCGAGCTG CCCGGACCGG CGCCGGGTGG CCGGCCCTGG 
GCCGGGCTAG CAGCCTTCGG CTGCGGCAAC TTCCGGGCTT CGGCCTTCGG CTACTTCGGG 
CACTGCTGGG AGTTGTACGC CTTCTGGACC CTGGTGCCTT TCCTGGTCGG CCGCGAGATC 
GAGCGCCTGG CACTGGGCCC GGGCTGGCTG CCCTGGTTGG CCTTCGCGGT CATCGCCCTG 
GGCCTGCCCG GCTGCGTCTG GGGCGGGCGC ATCAGCCGCT GGCTGAGCAG CTTCAATGTG 
GCCCGCCTGA CCCTGGCCAT CTCCGGCACC CTGTGCCTGC TCTATCCGCT GCTGGGGGAT 
GCCCCACCCC TCTTCCTTCT GGCACTACTT GCCGTTTGGG GGCTGGCCGT GATCGCCGAC 
TCGCCCCAGT TCTCCGCCCT GGCATCGGCG ACGGCGCCGC GCGCGCGCCT GGGCGCGGCG 
CTGGCTATCA TGAACGCCAT CGGCTTTGCC ATGACCCTGC CCGCCATTGC GCTAACCACC 
CATTTCTGGT CGCAGCAGGA GCTGGGGGTG ATGTGGTGGC TGCTCCCCGG ACCGGTGCTG 
GGCCTGCTGG CCCTGCACCG TATGAACCGG CACGCACTGC GGGAAATCTG A

Protein sequence

MLRNRLARHP LAVIVIAQLF GTSLWFSVNG VGLALSEAVA LSDTGLGLLT MAVQAGFITG 
TLIIATTGLA DRVRASRLFA IAAVTGAVIN AGFILVAGDL HLGVTARFLT GLCLAGIYPL 
GMKLVVSWTP RYAGAALGWL VGMLTLGTAL PHLLRGATFE LPWQWPLLLA SGLALVAAWL 
IHSLGDGPEL PGPAPGGRPW AGLAAFGCGN FRASAFGYFG HCWELYAFWT LVPFLVGREI 
ERLALGPGWL PWLAFAVIAL GLPGCVWGGR ISRWLSSFNV ARLTLAISGT LCLLYPLLGD 
APPLFLLALL AVWGLAVIAD SPQFSALASA TAPRARLGAA LAIMNAIGFA MTLPAIALTT 
HFWSQQELGV MWWLLPGPVL GLLALHRMNR HALREI