Gene Mlg_1937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1937
Symbol
ID	4270138
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2202254
End bp	2203879
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	66%
IMG OID	638126691
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_742769
Protein GI	114321086
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.158854
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.960341
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTTG TCAATCGCTT CAACAACTGG CCAATCTGGG TGCGGCTGCT GCTGGCCATC 
TGGCTCATGC TGGTGGTCGC CTGGAGTGCG CTCATCGCCT GGTCGGTCTA CGAACAGCGC 
AACACCGCGC TCACCCAGGC GGTCACCTTC AGTGAGACCA TGAATGAAAT GACCATGGCC 
GGTCTCACCA CGCTGATGAT CCTCTGGAAG ATGGATGACC GGGACGAGTT CCTGGACCAG 
ATCCTCGCCC TCCACAACAT GGAGGACCTG CGCGTGCTGC GCTCCGAGGC CGTCAGCCGG 
CAGTTCGGCG AGGGGTTGGC GGTGAGCCAG CCGGCCAATG CCGTCGAGGA GCAGGTGCTG 
GCCAGCGGTG AGGCGCATAT CGAGGTGGAG CCGGGGGGTG ATCACCTTTA CGCGGTCATC 
CCGAACGTCA ACGCGCGGGA CTACCTGGGT AAAAACTGCA TGGCCTGTCA CGCCATGGCC 
GAGGAGGACG AGGTGTTGGG GGCGGTCAGC ATGCGCATCG GCCTGCAGGA GGTGAACCAG 
GCCGTGTTCC GCTTTGGCAC CCTGGTCTTC GGCCTGGCGG TGTTGCTCAG CATCCCCTTG 
CTGGGCGTGG TCTATCTGTT CATCAAACGC TTCGTCTCCG CGCCGCTCAG CGATATGACC 
GAGCGGCTGG AGGACATCGC CAGCGGTGAC GGGGATCTGA CCCGCCGGCT GCCCGACCGG 
GGCACGGATG AGATCGGCAA GGCCTCGCTG GCCTTCAACC ACACCATGGA CAAGTTCCAC 
GACCTGGTGA AACGGGTGGT CAACACCGCC AGCCGGCTGA CCGATGCCGC AGACCGGGTC 
TCGTCCGTGA CCGTGCAGAC CAACCAGGGG GTGGAGTCCC AGCGCGAGCA GATCGAACAG 
GTGGCGACGG CCATGAATGA GATGACCGCC ACCGCCCAGG AGGTGGCCCG CAACGCGCAG 
GACGCCGCCC AGGCCACCCG CGCCGGTGCC GAGGCCTCGG AGCGGGGCCA GGATGTGGTG 
GAGCGCACCA TCGCCAGCAT CGACCGGTTG GCCGAGGAGG TGCAGAAGGC CTCTGAGGTG 
ATCCGCAAGC TGGCAGTGGA CAGCGAGCGC ATCGGTGAGG TCTCCGACCT GATTCGGGAG 
ATCGCCGAAC AGACCAACCT GCTGGCGCTC AACGCCGCCA TCGAGGCGGC CCGCGCCGGC 
GACGCCGGTC GCGGCTTTGC CGTGGTCGCC GACGAGGTCC GCTCGCTGGC CAGCCGGACC 
CACGAGTCCA CCCAGAGCAT CCAGGAGATG ATCAGCGGCC TGCAGCAGGA GACCCAGACC 
GCGGTCCAGG TCATGGAGGC CGGTTACGGC CAGGCGCAGC AGACCGTGGG GCAGGCGGGC 
GATGCCGGCG AGGCTTTGAA GGAGATCGCC TCCTCGGTAC AGACCATCAG CAGCTCCAAC 
GAGCAGATCG CCAGTGCGGC TGAGGAGCAG AGCGCGGTGG CCGAGGAGAT CAACCGCAAT 
ATCACCAGCA TCACCGATGT GGCCGAGCAG ACGGCCAACG GGTCCCGCGA GACCGCCACT 
GCTGGCGATG AGCTGGCGAA ACTGGCCCGG GAGCTGAAGG GGCTGGTGGG GCAGTTCAAG 
GTCTGA

Protein sequence

MNLVNRFNNW PIWVRLLLAI WLMLVVAWSA LIAWSVYEQR NTALTQAVTF SETMNEMTMA 
GLTTLMILWK MDDRDEFLDQ ILALHNMEDL RVLRSEAVSR QFGEGLAVSQ PANAVEEQVL 
ASGEAHIEVE PGGDHLYAVI PNVNARDYLG KNCMACHAMA EEDEVLGAVS MRIGLQEVNQ 
AVFRFGTLVF GLAVLLSIPL LGVVYLFIKR FVSAPLSDMT ERLEDIASGD GDLTRRLPDR 
GTDEIGKASL AFNHTMDKFH DLVKRVVNTA SRLTDAADRV SSVTVQTNQG VESQREQIEQ 
VATAMNEMTA TAQEVARNAQ DAAQATRAGA EASERGQDVV ERTIASIDRL AEEVQKASEV 
IRKLAVDSER IGEVSDLIRE IAEQTNLLAL NAAIEAARAG DAGRGFAVVA DEVRSLASRT 
HESTQSIQEM ISGLQQETQT AVQVMEAGYG QAQQTVGQAG DAGEALKEIA SSVQTISSSN 
EQIASAAEEQ SAVAEEINRN ITSITDVAEQ TANGSRETAT AGDELAKLAR ELKGLVGQFK 
V