Gene Mlg_2545 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2545
Symbol
ID	4270933
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2887649
End bp	2889319
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	71%
IMG OID	638127304
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_743375
Protein GI	114321692
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.668362
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.0765765
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATGACCA CCGCGCGGGC GAACGATTGG GCGGCGCTGC AGGTCTTCTG CGGCTACCGC 
CTGGTGGTGG TGCTGGCGCT GCTGTTGCTC TTCATCTGGG CCCGGGGCGA ACCCTTACTG 
CTGGCCGTGC GCTGGACGGA CGTCTTCCTG GCCACCCTGC TGGCCTACCT CGCCTGGTCG 
GTGGTGGCCT TATGGCTGCA GCAGCGACGG GTTCCGGCCT TCTCCCTGCA GCTTTACGCC 
CAGTTGGGCG TGGATGTCCT GGCACTGAGT CTGCTGGTAG CGGCCACCGG TCGGATGGAC 
GGCGGGCTTG CCCTGCTGGT GTTGATCGTG GTGGCCGGTG GCAGCCTGAT GCTGGCCAAT 
CTGCGCCTGG CGCTGGGGTT GGCGGCCATG GCCACGCTCG CCCTGCTGGC GGTCCAGGGC 
TTCGTGGCCC TCTACGCCGA CGGCGCCGCT GAGGGCTACA CCCTGGTGGG GATGTACGGC 
ATGGGCCTGT TTCTGCTCGG CGCCGGCGGT AGCCTGCTGG CCATCCGCGT GCGTACGGCG 
CAGGCCCTGG CCGAACGCCG CGGGGTGGAC CTGGCCAACA TGCAGGCGCT AAACGAGCAC 
ATCGTCCAGC ACATGGAACC GGGGGTGGTG GTGGTGGACG GGGCCGGCAT CATCCGGCTG 
CTCAACCATT CCGCCATGGG CTGGCTGGCC AGCGGCCGCG GCGCGGCGCT GGAGCATGTG 
GCGCCGACCC TGGATCTCGC AGTGCGGCGC TGGCGGCGGG GCCGGGTGGG TTCCGGCCTG 
GTGGTGCCGG TGCAGGCGCG TGGCGCCGAG GTGCGGGTGA ACATCTCCGC GCTGGGCGCG 
GACCCGGAGG GGCCGTTGTT GCTGTTGCTG GAGGACCAAG CGGAACTGCG TGCCCGGGTG 
CAGCAGGCCA AACTGGCCGC CCTCGGCCGG CTGACGGCCA GTATCGCCCA CGAGATCCGC 
AATCCGCTCA GTGCCATTCT GCATGCCGGG CAACTGCTGG CCGAGTCGCC GGATCTGAGC 
GAGGATGACC GGCGGTTGCT GGACATCGTT CGCCGCCACG GCCGGCGGCT CAACACCATC 
GTCGAGGACG TGCAGCAACT CTCCCGGCGG GGACGGGCGC GGCGGGAGGC GGTGGCGCTG 
GACGCCTTTC TTCAGGAGTT CCTGCAGCGC TGGGGCGAGC AGCACGGCCG GGAGGGGGCC 
CGCATCCGCT GTCGGGTGAC GCCGGCGGGG CTGTTGGTGC TGTTCGACCC CAACCACCTC 
CACCAAGTGT TGACCAACCT GGTGGAGAAC GCCGTTCGCC ACGCCTCGGA CGGCCGCCCG 
AGGGTGACGG TCACCCTGAG CGGACGGCAG CCGCAAGCCG GGGAGGCGTG GCTGGAGATC 
TGCGACGATG GCCCCGGTGT CGGGCGGGAT ATCGCCAACA GTGTGTTCGA GCCCTTTTTC 
ACCAGCCGGC CGTCCGGGTC TGGGCTGGGG CTCTTCATCT GCCGGGAGCT CTGCGAGAGC 
AATCGGGCCG ATCTCCGCCT GAGCAACCCG GGCGAGGCGG GGGCCTGCTT CCGGCTGACG 
TTGCAGATGG CGCCAGCGGG GGTACCGGCG GGCTGGCAGG AGCCGGAGAC CGAGGTCCGG 
CTCAGCCGGT CTGCGGATGG GGACGCGCCA GCGCCGGCAG CTCGCCGCTG A

Protein sequence

MMTTARANDW AALQVFCGYR LVVVLALLLL FIWARGEPLL LAVRWTDVFL ATLLAYLAWS 
VVALWLQQRR VPAFSLQLYA QLGVDVLALS LLVAATGRMD GGLALLVLIV VAGGSLMLAN 
LRLALGLAAM ATLALLAVQG FVALYADGAA EGYTLVGMYG MGLFLLGAGG SLLAIRVRTA 
QALAERRGVD LANMQALNEH IVQHMEPGVV VVDGAGIIRL LNHSAMGWLA SGRGAALEHV 
APTLDLAVRR WRRGRVGSGL VVPVQARGAE VRVNISALGA DPEGPLLLLL EDQAELRARV 
QQAKLAALGR LTASIAHEIR NPLSAILHAG QLLAESPDLS EDDRRLLDIV RRHGRRLNTI 
VEDVQQLSRR GRARREAVAL DAFLQEFLQR WGEQHGREGA RIRCRVTPAG LLVLFDPNHL 
HQVLTNLVEN AVRHASDGRP RVTVTLSGRQ PQAGEAWLEI CDDGPGVGRD IANSVFEPFF 
TSRPSGSGLG LFICRELCES NRADLRLSNP GEAGACFRLT LQMAPAGVPA GWQEPETEVR 
LSRSADGDAP APAARR