Gene Mlg_1670 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1670
Symbol
ID	4268902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1911115
End bp	1912455
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	69%
IMG OID	638126428
Product	signal transduction histidine kinase, nitrate/nitrite-specific, NarQ
Protein accession	YP_742506
Protein GI	114320823
COG category	[T] Signal transduction mechanisms
COG ID	[COG3850] Signal transduction histidine kinase, nitrate/nitrite-specific
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTAACG TGAATGCGCC CGCATGGTTC CATTCCGCGG CTCGGTCGAT GGTGCCTATG 
GGAAAACGCC TGCCCGTCTC GCTCGTGGAG GTGCCGGCGG AGAGCAACGC GGTTCCGCCG 
CATGACCGGG CGGGCCCTGA GAACGACGAG ATCGTGGCCC TGCGCGAGCG TGCGCGGGCC 
ATGGAAGTGC TGTATACGCT GAGCACCTCC AGCGAACGCT GTGATGATCT GGAAACCCTG 
CTCAGTGGAG CGCTGGAGCA ATTGATGCGC GCCACCGGGG CCACTGCCGG CGTGGTCCGC 
CGTATGGACG CAGAGGGCAC GCTGCGCCTG GTGGCCGCCC GTGGCGTCGG CGACGACTAC 
CCCGAAAACG ACTGTGGGGT CCGGCCGGAG GACTGCGCCT GTGGTGAGGC CGCCCTCCGC 
GGATGTCTGA TCTCCAACCC CGGTATGAAG GGTTGCCGCC ATAAGCGCTA CCAGCGCCCC 
ATCGGGCACG AGGACCTGCA CCTGCTGGCG GTGCCGTTGA CCGCTGACGA CCGCCGCCTG 
GGCGTGTTCA GCCTGTTCCT CGAGCCGGTC ATGCTGCAGC AGTGGCAGCA GCTCAATCTG 
CACCGCATGC TGCAGATGGC CGGCGAGCAC CTCGGGCTGG CGATGGAGCG CATCCGGCGC 
GAGAGCGAGG CCCGCCTGCA ATCGCTGGAG CAGGAGCGCA GCCAGATCAC CCACGAACTC 
CACGATTGCC TCGCCCAGCG GTTGGCGGCG TTGGGCCTGG AGGTGCGCAA CCTGGAGGCC 
AGCCACGGCG GTGGACGGGC GCCGGGCGGG CTGCGTGCCG GCCTGCGCCA TGTGCGGCGC 
GGCCTGGACC AGGCCTATGG CGAACTGCGT CAACTCATGG GGCAATTCCG TATCGCCCTG 
GAGGGGGGTG GCCTGGAGCC CGCGCTCAAA CGGCTGGTGC ACCGTTTCCA GCGCGATAGC 
GGCATCCGGG TGCTGCTCAG CCATGACTGG CCGCGGGGAC GGCTCAGTCC CGACCAAGAG 
TTCCAGGTCC TGCGTATCGT GCAGGAGGCG CTGAACAATG TCAGGAACCA CAGCGGCGCC 
CGCCATGTTC AGGTGGCCTT GCACCGGATT GGCTGCGACA TGGAGCTGGT GGTGGAGGAC 
GACGGGCGCG GTTTCGCCGA TTCGCCGCCG GATCACCGTG ACGGTGACGA CGGCCACCAC 
TTGGGCCTGG GCGTGATGCG CGACCGCGCC GACGCCATCG GCGGCCATCT GGAGATCCAA 
AGCGAACTGG GGGAGGGGAC CCGGATCGCC GTCTATCTGC CTTCCTGCGG CCGTTGCCCC 
GGTCGGGAGG AACGGGGCTG A

Protein sequence

MGNVNAPAWF HSAARSMVPM GKRLPVSLVE VPAESNAVPP HDRAGPENDE IVALRERARA 
MEVLYTLSTS SERCDDLETL LSGALEQLMR ATGATAGVVR RMDAEGTLRL VAARGVGDDY 
PENDCGVRPE DCACGEAALR GCLISNPGMK GCRHKRYQRP IGHEDLHLLA VPLTADDRRL 
GVFSLFLEPV MLQQWQQLNL HRMLQMAGEH LGLAMERIRR ESEARLQSLE QERSQITHEL 
HDCLAQRLAA LGLEVRNLEA SHGGGRAPGG LRAGLRHVRR GLDQAYGELR QLMGQFRIAL 
EGGGLEPALK RLVHRFQRDS GIRVLLSHDW PRGRLSPDQE FQVLRIVQEA LNNVRNHSGA 
RHVQVALHRI GCDMELVVED DGRGFADSPP DHRDGDDGHH LGLGVMRDRA DAIGGHLEIQ 
SELGEGTRIA VYLPSCGRCP GREERG