Gene Hmuk_2120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2120
Symbol
ID	8411658
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	2029330
End bp	2030484
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	66%
IMG OID	645020461
Product	histidine kinase
Protein accession	YP_003177940
Protein GI	257388167
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.238176
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.722587
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATTCG AAAACCAGAC GGACTTCGCC AAGCAGGTCG CCGACCTCAA CAAGTACGGA 
CAGGCGCTGA ACCGATGTGA GAGCGTCGAC GAGGTCGTTT CGATGACGCT GGAAGCGATG 
TCACTGCTGT TCGACGCCGC CGACAACACG TTCGTGGAAG TTCGAAACGA CGACCTGCAG 
GTCGTCCACA GCACGAATCC CGCGTTGTCG GTCGGCGAAG CGCCGACGAG CGTGGCACGG 
CGGGCCTACG AGTCCAGAAC GACCGAGGTG GCCAGCGGTG CGGACGCTCG TGCCGCCACC 
GACACGGAGA CGACCGCGGC ACTGGCCGTC CCGGCGACGA TCGTCGACGA GGTGACGGCG 
GTGCTCGTGA TGCGCTCGAC GAGCCGGTCC GAGTTCGACG ACACCGTCGT GCGCCCGATG 
GAGATTCTGG CGTCTCACGC CGCGACGGCG ATCAGCAACA TCCGGTCGCG GGAGCGACTC 
GAACGGGCCA GACAGGACCT GGAGACGAAA AAGGAGATGG TCGAACTGTA CGACCGCCTG 
TTGCGCCACG ACCTGGGCAA CGACCTGCAG GTGATCACCG GGTTCTCCGA GGTCCTCGCC 
GACGAAGCCG ACGGCGAGAC CGCTGCCTAC GCCGAGCGGA TCAACGAGGC CGCACACAGC 
TCTGCCGACC TGATCCAGCG GGTCGGGAAC CTCGTCTCGA CGCTGGAAGA AGAAGAGGAA 
CCGGAACCGA GAGGCCTCGC GCCGATACTC GAACGGACCG TCAGTGAGGC CGAGACCGGC 
TACGGCGAGC TGACCGTCGA GTTCGACAAG GCGGCATTCG AGGAGACGGT GTACGCCGGG 
GACCTGCTCG AATCGGTGTT CACGAACATC CTCACGAACG CCGTCGTCCA CAACGAGGGA 
GAAGTCACGG TCCGGACGAG CGTCGAGACG GGCGTCGACG ACGTGGTTGT CTGCTTCGCC 
GACGACGGAG CGGGCATCGA CCCGTCGGTC CGCGACGAGC TGTTCGAGAT GGGCGAGAAA 
GGCCCCGACA GCAGCGGCAG CGGGTTCGGC CTCGGCTTCG TCCGCGCCCT GACCGAGTCG 
TACGGCGGCG ACGTGACCGT CACCGAGAGC GATGCCGGCG GCGCGGAGTT CCGCGTTCGG 
CTCCAGCGTG GCTGA

Protein sequence

MSFENQTDFA KQVADLNKYG QALNRCESVD EVVSMTLEAM SLLFDAADNT FVEVRNDDLQ 
VVHSTNPALS VGEAPTSVAR RAYESRTTEV ASGADARAAT DTETTAALAV PATIVDEVTA 
VLVMRSTSRS EFDDTVVRPM EILASHAATA ISNIRSRERL ERARQDLETK KEMVELYDRL 
LRHDLGNDLQ VITGFSEVLA DEADGETAAY AERINEAAHS SADLIQRVGN LVSTLEEEEE 
PEPRGLAPIL ERTVSEAETG YGELTVEFDK AAFEETVYAG DLLESVFTNI LTNAVVHNEG 
EVTVRTSVET GVDDVVVCFA DDGAGIDPSV RDELFEMGEK GPDSSGSGFG LGFVRALTES 
YGGDVTVTES DAGGAEFRVR LQRG