Gene Mlg_2061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2061
Symbol
ID	4270447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2335350
End bp	2336678
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	69%
IMG OID	638126817
Product	major facilitator transporter
Protein accession	YP_742893
Protein GI	114321210
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.310539
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGCGG ATCATCACTG GTATGCCAAT CCGACACTGG ACAAGGCCTA CCGGACGCTG 
GTGGACGAGG AGGATGCGCG GGTCTGCCGC GACATCAGTG ACGAAGCCTG TCAGGTGGTG 
CCGGGCAACT TTTTCCTGCA GATCCTCAGC CATTTCTTCA CCAAGCTGGG TGATGCGGTG 
GCCAACCCGA AGACGGTGCT CGCCTGGCTG CTCAGCGCGC TCTCGGCCCC GGGCTTTTTC 
ACCGCCCTGC TGGTGCCCAT CCGCGAGTCC GGCTCGCTGA TCCCGCAACT GTTCATCGCC 
AGCTACGTGC GGCGCCTGGC GCGACGCCAA TGGGCCTTCG TCGTCGGTTG TATCCTGCAG 
GCGGTGGCGG TACTGGCCAT GGCCCTGATC GCGGTGGGCC TGGAGGGCGC CGCCGCGGGC 
ACCGCGTTGA TCGGCGCACT GGTACTGTTC AGCCTAGCCC GCGGGCTCTG CTCTGTGGCC 
TCCAAAGACG TGCTCGGTAA GACCGTGCCC AAGACCCGGC GCGGCCAGGT CAACGGCTGG 
TCCGCCTCCG CGGCCGGCCT GGTGACCATC GGCGTGGGCG CCCTGTTGCT GCTGGGAGGG 
GGCAGCCCTG GCGAGACCGG CATCTATCTG TTGCTGCTCG GCGGGGCGGC CCTGCTCTGG 
CTGCTGGCGG CGGCCGGCTA TGGCGCGATT CGTGAGTACC CCGGGGCCAC CTCCGGCGGC 
GGCAATGCCT TCACCGAGGC CGTCCAGCGC CTGGACCGGT TGCGCACCGA CGAGCCCTTC 
CGGCGCTTTG TCATCGCCCG CGCCCTGCTG CTCTGCTCGG CGCTCACCGC CCCCTTTATC 
ATCATGCTGG CCCATGAGCA GACCGGGGGC GCGGCGCTGG TCCTGGGCCT GTTTGTCATC 
GCAGATGGCC TGGCGAGCCT GGTCTCCGCC CCCTTCTGGG GCCGGTTCGC CGACACCTCC 
AGCCGGCGGG TGATGGTGGT CGCCGGGGCC GGCGCGGGGA TGGTGGGCCT GGGACTGGTC 
CTGCTGGTCC AGGCGCTGCC GCCACTGGCG GGCAGCGCCT GGCTGTACCC GCTGTTCTTC 
TTCCTGCTGG CCATCGCCCA CGCCGGCGTG CGGCTGGGCC GGAAGACCTA CGTGGTGGAC 
CTGGCGGGTG GGGACAAACG CACCGATTAC GTGGCGGTCA GTAATACGGT GATCGGGGTG 
GTGCTCCTGC TGATGGGGGG GGTCGGATTG CTGACGGCGG TGATACCGGT CTCCGGCGTC 
ATCCTCATCC TGTCAGGGAT GGGGATCGCC GGGGCTTGGC TGTCCGCCCG CCTGCCCGAG 
GTCACCTGA

Protein sequence

MAADHHWYAN PTLDKAYRTL VDEEDARVCR DISDEACQVV PGNFFLQILS HFFTKLGDAV 
ANPKTVLAWL LSALSAPGFF TALLVPIRES GSLIPQLFIA SYVRRLARRQ WAFVVGCILQ 
AVAVLAMALI AVGLEGAAAG TALIGALVLF SLARGLCSVA SKDVLGKTVP KTRRGQVNGW 
SASAAGLVTI GVGALLLLGG GSPGETGIYL LLLGGAALLW LLAAAGYGAI REYPGATSGG 
GNAFTEAVQR LDRLRTDEPF RRFVIARALL LCSALTAPFI IMLAHEQTGG AALVLGLFVI 
ADGLASLVSA PFWGRFADTS SRRVMVVAGA GAGMVGLGLV LLVQALPPLA GSAWLYPLFF 
FLLAIAHAGV RLGRKTYVVD LAGGDKRTDY VAVSNTVIGV VLLLMGGVGL LTAVIPVSGV 
ILILSGMGIA GAWLSARLPE VT