Gene Mlg_2498 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2498
Symbol
ID	4270817
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2838749
End bp	2840062
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	67%
IMG OID	638127256
Product	aromatic hydrocarbon degradation membrane protein
Protein accession	YP_743328
Protein GI	114321645
COG category	[I] Lipid transport and metabolism
COG ID	[COG2067] Long-chain fatty acid transport protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.953303
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGTC TTACCGCAAC CACTGTTCGC GGCCTGATCA CCGGCGCGGG TCTTGGGGGC 
CTGCTGATCC CGGGGCTGGC CCTCGCCACC AACGGCTACC AGCTCACCGG CCTGGGCAGC 
CACGAAAAGT CGCTCGGCGG GGCGGTCACC GCCGCACCGC GCAGCGCGAT GACGGCCATC 
AGCAACCCGG CCGGTATCGG CCGCATCGGG TCCCGCGTCG ACTTCTCCAT GGAGGTCTTC 
AGCCCCGAGC GGAGCACCGA CTTCCGGGCC CTCGGGGGCG AGAAGGTCAC CAGCGACACC 
GACACCTATA TCATTCCGAG CCTGGGCTGG GCGGCCCCCA TCACCGAAGA CCGCCGCCTG 
TGGTTCGGCG GGGGCTTCTT CGGCACCTCC GGGCTCGGTG TCGATTACGC GGTGACAGAC 
GTCATGCCCA ACGGGCAGCT CATGAACGGC CACACCCAGT GGGACGGCTA CAGCTCGATC 
TTCTTCGCCC AGATGACGCC GGTGCTTTCA CTGCGGGTGA ACGACCGCCT CACCGTTGGC 
GCCGGCCCGG TGCTCGCGCG CCAGCAGGTG GCCCTGAAAC AGCGCTTCCA CGACATGCCG 
GTCGGGCCGG GCATGGTGAT GGACACCAAC TTTGACCTCA GCAAGGCCAG CAGCGCCCTT 
GGTGCTGGTG TCAGCCTGGG CCTGATCTAC GACCTTGGCA CCCGGTGGCG GCTGGGCGCC 
ACCTACCAGA GCAAGATCCA CTTCGAAGAC CTGCGCTACA ACCTGGCCGC CGGCGACATT 
CATGGCCAGG ACAGCAACGG CGAGTTCGTC GACGGCGAGG CGGGCACCTG GCGGCTGGGC 
CTCGACTACC CGCAACAGGC CAGCGTGGGC CTGGCCTGGG CGGCAAACAA CACCCTCACC 
CTCTCCGCCG ACGTGAAGTG GCTCAACTGG TCCGACACCA TGGATGAGTT GACCGTAAAG 
GGCCCCAATG GCAGCCGCTT CGCCCTGGAC CCCGGCTGGG ACGACCAGTG GGTCTTCGCC 
GCCGGCGCGG AGTGGGTGGT GAACCCCGAG CGGCTCACCC TTCGCGCCGG CGTCAACTAC 
GCCGAATCCC CCCTCGATGA CGAGGACGTG GCCACCAACC TCCTGCTACC GGCGGTGGTG 
GAACGCCATG TCGCCCTCGG CGGCACAGTG CGGATGGTCA ACGGCTGGGA CCTGGGCTTC 
CACCTCAAGC ACGCCCTGAA GAACAAGCAG ACCCAGGACG GCGGCCCCTT TGACGGCGTC 
TCGGTGGAGA TGGACCAGTG GTCCGCCGGA CTCAATATCG GCTACGCCTT TTGA

Protein sequence

MKRLTATTVR GLITGAGLGG LLIPGLALAT NGYQLTGLGS HEKSLGGAVT AAPRSAMTAI 
SNPAGIGRIG SRVDFSMEVF SPERSTDFRA LGGEKVTSDT DTYIIPSLGW AAPITEDRRL 
WFGGGFFGTS GLGVDYAVTD VMPNGQLMNG HTQWDGYSSI FFAQMTPVLS LRVNDRLTVG 
AGPVLARQQV ALKQRFHDMP VGPGMVMDTN FDLSKASSAL GAGVSLGLIY DLGTRWRLGA 
TYQSKIHFED LRYNLAAGDI HGQDSNGEFV DGEAGTWRLG LDYPQQASVG LAWAANNTLT 
LSADVKWLNW SDTMDELTVK GPNGSRFALD PGWDDQWVFA AGAEWVVNPE RLTLRAGVNY 
AESPLDDEDV ATNLLLPAVV ERHVALGGTV RMVNGWDLGF HLKHALKNKQ TQDGGPFDGV 
SVEMDQWSAG LNIGYAF