Gene Hmuk_2699 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2699
Symbol
ID	8412250
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	2585538
End bp	2586878
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	66%
IMG OID	645021045
Product	multi-sensor signal transduction histidine kinase
Protein accession	YP_003178512
Protein GI	257388739
COG category	[T] Signal transduction mechanisms
COG ID	[COG4251] Bacteriophytochrome (light-regulated signal transduction histidine kinase)
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.112792
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.0892885
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCCG AGACGCTGGC CGAGGACCAC GGCTTCGGTA CGCACGCGGC CAGCGACCCG 
AAGGCTGCTC TCGACTACTT CTCTGACAAC GACGTGGACT GTATCGTGAG CGACTACGAG 
ATGCCCGGAA TGGACGGCCT GGAGTTCCTC GATGCGGTCC GGGAACGCGA GTCCGACATC 
CCCTTTATCC TCCTCACCGG GCGCGGCGAC GAGGAGGTCG CCAGCGAGGC CATCGCCGCG 
GGTGTCACCG ACTACCTGCT GAAGCTCGAG GTCGTCGAAG ACAAGCAGTA CGGCCGACTC 
GCGAACAGAA TCCGAAACGT CGTCTCGAAG CGCCGCACCC AGGCCAAGTA CGAGCTGCTG 
GTCGACACCT CGCCGGACCT GATCGCACAG GTCGCCGAGG ACGGGACGAT CCTCGCGGCC 
AACCCCGCGA TGGCCGAGTT CACCGACATC AGCCGAGCGG AACTCGTCGG CCAGACGCTC 
GCTGCGGTCC TCGGGACGAT CGGTGAAGAG CGGACGGCAG TCGGCCAGTC CGTCATCGAG 
GACGGCGATC CCACCCACGC AGAAGACCAG ATCGACGGCC GGTCGTTTCA CAACATCTAC 
GTCCCGATCG ACGTACACAG CCACCGGCCG TCGTTCCAGC TGGTCTCTCG GGACATCACG 
GAGCGCGTCG AACGCGAACG AGAGCTCAAG CGTCAGAACG AGCGCCTCGA AGAGTTCGCC 
AGCGTCGTCA GCCACGACAT GCGAAATCCG CTCAACGTGG CCCAGTCCGC ACTCCAGTTG 
TTAGAGAAAG ACAGGGGAGA CGACGCCGAG CTGCGGGCGA GACTGACGCG CTCGCTCGAC 
CGGATGGAGT CGCTGATCGA CGACGTGTTG ACACTCGCTC GCGAGGGCGA GACCGTCGAC 
GACCCCAGCG TCGTCGACCT TGGGACGATC GCCCGCGAGA GCTGGATGGT GACCGACAGC 
GGCGAGGCGG AGCTGGTGAT CGACTCGTCG GCCCGGATTC AGGCCGACGA CGGCCGTCTC 
GGGAGCATCT TCTCGAACCT CTACGGGAAC GCCGTCGACC ACGGCCGCCC CTCGTCGGAC 
GCCGAGAACG CCGAGCCGGT GACCGTCACC GTCAGCGTGA CCGACGACGG GTTCGTCGTC 
GCCGACGACG GCTGTGGCAT GGACCTCTCG ACGGACGGCG ACCCCTTCGA GATGGGGTAC 
TCAAGCGACA CCGAGGGGAC CGGCATGGGA CTGACCATCG TCGAGCGGGT GGCCGAGGCC 
CACGGCTGGT CGGTCGACCT CGGCGAGAGC GAGGACGGCG GTCTGGCCGT CGAGATCAGC 
GGCGTCACCT TCGTCGAGTG A

Protein sequence

MTAETLAEDH GFGTHAASDP KAALDYFSDN DVDCIVSDYE MPGMDGLEFL DAVRERESDI 
PFILLTGRGD EEVASEAIAA GVTDYLLKLE VVEDKQYGRL ANRIRNVVSK RRTQAKYELL 
VDTSPDLIAQ VAEDGTILAA NPAMAEFTDI SRAELVGQTL AAVLGTIGEE RTAVGQSVIE 
DGDPTHAEDQ IDGRSFHNIY VPIDVHSHRP SFQLVSRDIT ERVERERELK RQNERLEEFA 
SVVSHDMRNP LNVAQSALQL LEKDRGDDAE LRARLTRSLD RMESLIDDVL TLAREGETVD 
DPSVVDLGTI ARESWMVTDS GEAELVIDSS ARIQADDGRL GSIFSNLYGN AVDHGRPSSD 
AENAEPVTVT VSVTDDGFVV ADDGCGMDLS TDGDPFEMGY SSDTEGTGMG LTIVERVAEA 
HGWSVDLGES EDGGLAVEIS GVTFVE