Gene Mlg_1518 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1518
Symbol
ID	4269074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1731293
End bp	1732531
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	72%
IMG OID	638126276
Product	toxic anion resistance family protein
Protein accession	YP_742357
Protein GI	114320674
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3853] Uncharacterized protein involved in tellurite resistance
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.150292
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.25035
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAAGA CCCCCGAGCC GCCCCAGGGC GGCGAGTTTC ACCTGGCATT GCCGCCGGTC 
GATGAGATCG CCGAGTCGGT GAAGCGCGGC GCCGAGGAGG CCGCCGCCGC CGACCGGGAG 
GACCTGGCGC GGCAGGCCGA CACCTTTGTC CGCGACCTGC TCGAGGCGCT GCCCGATGAG 
GACGCCCCGG CCGGCGCCGC TCGCCAGCGC GAGGTCATCG ACTACATGGG GATCGAGGTG 
CAGCGCCAGG CGGCGCGGCG CAGCGCCATG CTGCAGGAGC CCATCCGTAA ACTCGCGCAT 
CAGGGGGAGG AGGGCGGCCC GGTGGCCCGC ACCCTGCTGG ATCTGCGCCA GCAGATGTCG 
GCACTGGATC CGCGGGGGCG GGACCTCGCC CCGGGGCTGC TGGACCGCCT GCTGGCGCGG 
ATTCCGGGCG TGGGCACCAA GGTGCAGCGC TACTTCCGTC AGTTCGAGAC CGCCCAGCAG 
GCGCTGGACG CCATTATCCG CGACCTGGAG ACGGGGGCCC GGATGCTGCG CCGGGACAAC 
CTCACCCTGT CCGACGATCA GGCCGAGCTG CGGGAGGTGC TGGCCGAGCT GGCGAGCCAT 
ATCGAGCTGG GCAAGCTGAT CGACGCCCGG CTGGTGGCGG CGGCGGAGGC GCTGCCGGAG 
ACCGCCCCAC GCCGGGCCTT TATCGAGGAG GAGCTGCTCT TCCCGCTGCG CCAGCGTATC 
GTCGACCTGC AGCAGCAACA GGCGGTGAGC CAGCAGGGCG TACTGGCGCT GGAGGTGGTA 
ATCCGCAACA ACCGGGAACT GATCCGCGGG GTGGACCGGG CGATCAATGT CACTGTCTCG 
GCGCTCAATG TGGCGGTGAC CGTGGCGCTG GGGTTGGCCA ATCAGCGCTT GGTGCTGGAC 
CGGGTGGAGG GCCTGAACCG GACCACCTCG GACATGATTG CCGGCACCGC CCAGGCCCTG 
CGGCGCCAGG GCGCTGAGAT CCAGACGCGC GCCGCGGCCA CCATGCTGGA CATGGAGCAG 
CTCGAGGCGG CCTTCGAGGA TGTGCTGGGC GCCATTGACG CCCTGTCCCG CTACCGGCAG 
GAGGCCCTGC CGCGCCTGGA TGAACAGATC GACCGCCTGG ATACCCTGGC GCGCCGGGGC 
CAGGGGGCGA TCGAGCGGCT GGAGCAGGGC AACCAGGCGT GGTCGGAGGA TGAGGCGCCG 
GACGCCGGCG AGGGGGAGGG CGGCCGTCCC CGCGGTTGA

Protein sequence

MAKTPEPPQG GEFHLALPPV DEIAESVKRG AEEAAAADRE DLARQADTFV RDLLEALPDE 
DAPAGAARQR EVIDYMGIEV QRQAARRSAM LQEPIRKLAH QGEEGGPVAR TLLDLRQQMS 
ALDPRGRDLA PGLLDRLLAR IPGVGTKVQR YFRQFETAQQ ALDAIIRDLE TGARMLRRDN 
LTLSDDQAEL REVLAELASH IELGKLIDAR LVAAAEALPE TAPRRAFIEE ELLFPLRQRI 
VDLQQQQAVS QQGVLALEVV IRNNRELIRG VDRAINVTVS ALNVAVTVAL GLANQRLVLD 
RVEGLNRTTS DMIAGTAQAL RRQGAEIQTR AAATMLDMEQ LEAAFEDVLG AIDALSRYRQ 
EALPRLDEQI DRLDTLARRG QGAIERLEQG NQAWSEDEAP DAGEGEGGRP RG