Gene Mlg_2274 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2274
Symbol
ID	4268237
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2577009
End bp	2578811
Gene Length	1803 bp
Protein Length	600 aa
Translation table	11
GC content	68%
IMG OID	638127031
Product	extracellular solute-binding protein
Protein accession	YP_743106
Protein GI	114321423
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCCAGC GTATCGTCCG GACCTTCGTC ATGGCCCTGG GCCTGATCGG CCTGCCCGCG 
GCCGCCTTGG CCGGTGGTCA CGCCATCGCG CTGCACGGCG AGCCCAAGTA CGGTCCCGAC 
TTCGAGCACT TCGACTACGT CAACCCCGAC GCCCCCAAGG GCGGGGCGGT GCGCCTGTCC 
GCCCTGGGCA CCTTCGACAG CCTGCACCCC TATATCCTCC GCGGGGTGCC GGCCCAGGGG 
CTGAGCCAGG TCTTCGACAG CCTGACCGAG AACAGTGCCG ACGAGCCCTT TACCGAGTAC 
GGGCTGATTG CCGAGACCAT TGAGGTGGAC CCGGAGGGCT ACTGGGTGCG CTTTGACCTG 
CGGCCCGAGG CGCGCTTCCA CGACGGCGAG CCCATCACCG TGGACGACGT CATCTGGACC 
TTCGAGACCC TGCGCGAGCA CGGTCACCCC TCGCTGCGCA GCTACTACCG CGACGTGGAG 
CGGGTCGAGC GGACCGGCGA GCGCCAGGTG ACCTTCCACT TCGCTGGCAA TGAGAACGCC 
GAGCTGCCGC TGATCGTCGG GCAGATGCCG GTGCTGCCGG AGCACTGGTG GGCGGACCGC 
GAATTCGATC GCACCACCCT GGACAAGCCC CTGGGCAGCG GCCCCTACCG GGTGGCCGAG 
GTGCGCCAGG GCCGGCATAT CGTCTACGAG CGGGTGGAGG ACTACTGGGC CGCCGACCTG 
CCGGTGAACC GCGGGCGCCA CAACTTCGAC CGCATCCGTT ACGACTACTA CCGCGACGCC 
GATGTGGCGC TGGAGGCCTT CCGGGCCGGG GAGTATGACT TCCGTCCCGA GAACATCGCC 
CGCAACTGGG CCAATGCCTA CGATTTCGCC GCGGTGCGCG AGGGCCGGGT GCAGCGCGAG 
GAGATCGCCC ACGAGATCCC CACCGGGATG CAGGGCTTCT TCATTAACAC CCGGCGTGAC 
CGCTTCAGCG ATCCGCGGGT GCGTGAGGCG TTGTCGCTGG CCTTCGATTT CGAGTGGACC 
AACCGCAACC TGTTCCACGA TGGCTACACC CGTACCCGGT CCTACTTCTC CAATTCGGAA 
CTGGCGTCCG ACGGGCCGCC CTCGGCCGAG GAGCTGGAGA TCCTCGAGCC CTACCGCGAT 
CAGTTGCCGG AGGCGCTGTT CGAGTCCGCC TTCGAGCCGC CGAGCACCGA AGGGGATCGC 
GGCCTGCGCC GCAACCTGCG GCAAGCGGCG GCCCTGCTGC GGGAGGCCGG CTGGGTGGTC 
GAGGACGGCC GGCTGGTGCA CGGCGAGACC GGTGAGCGCA TGCGCTTCGA GGTGCTGCTG 
GATAACGCCA GCTTCGAGCG GGTAGCCCTG CCCTGGCGGC GCAACCTGGA GCGGTTGGGC 
ATGGAGGTGA GTGTGCGTAC CGTGGACACT TCCCAGTACC AGAGCCGCAT GGATGAGTTC 
GACTTCGACA TCACCGTGCA GTTGATCGGC CAGTCCCTGT CGCCCGGCAA TGAGCAGCGC 
AACTACTGGA GCTGCGCCGC CGCCGAGACC CCGGGCAGCC GCAACTACGC CGGCATTTGC 
GACGAGGTGG TGGACGCGCT GATCGAGCGC ATCATCCACG CCCCCGATCG CGACACCCTG 
GTGGCCGCCA CCCGCGCCCT GGACCGGGTG CTGCTGCACG GCCACTATGT GGTGCCCCAC 
TGGCACCTGC CGGCCTTCCG GTTGGCCTAC TGGGACAAGT TCGACCGCCC GGAGACCAGC 
CCGAAATACG CCCTGGGCTT TGACACCTGG TGGTACGACG AAGAGCGCGC CGCCGAGCTT 
TGA

Protein sequence

MPQRIVRTFV MALGLIGLPA AALAGGHAIA LHGEPKYGPD FEHFDYVNPD APKGGAVRLS 
ALGTFDSLHP YILRGVPAQG LSQVFDSLTE NSADEPFTEY GLIAETIEVD PEGYWVRFDL 
RPEARFHDGE PITVDDVIWT FETLREHGHP SLRSYYRDVE RVERTGERQV TFHFAGNENA 
ELPLIVGQMP VLPEHWWADR EFDRTTLDKP LGSGPYRVAE VRQGRHIVYE RVEDYWAADL 
PVNRGRHNFD RIRYDYYRDA DVALEAFRAG EYDFRPENIA RNWANAYDFA AVREGRVQRE 
EIAHEIPTGM QGFFINTRRD RFSDPRVREA LSLAFDFEWT NRNLFHDGYT RTRSYFSNSE 
LASDGPPSAE ELEILEPYRD QLPEALFESA FEPPSTEGDR GLRRNLRQAA ALLREAGWVV 
EDGRLVHGET GERMRFEVLL DNASFERVAL PWRRNLERLG MEVSVRTVDT SQYQSRMDEF 
DFDITVQLIG QSLSPGNEQR NYWSCAAAET PGSRNYAGIC DEVVDALIER IIHAPDRDTL 
VAATRALDRV LLHGHYVVPH WHLPAFRLAY WDKFDRPETS PKYALGFDTW WYDEERAAEL