Gene Mboo_1119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1119
Symbol
ID	5411363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	1119490
End bp	1121280
Gene Length	1791 bp
Protein Length	596 aa
Translation table	11
GC content	54%
IMG OID	640868345
Product	multi-sensor signal transduction histidine kinase
Protein accession	YP_001404280
Protein GI	154150662
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACGAC AGGTTACCCT CCGGGGATAT TCATTCTCAC ATACCGATCT GGTCCGTTCC 
ATCGTCATTG CCTCGCTGAC TGTTTCTGTT ATCCTGATAA CCGCACTGGC TCTTGCCAAA 
AATGCCGGGG ACCTCTATCC CCAGCTCTTT TATTTTCCCA TCCTGTATGC AACGTATTTC 
TATCCCAAGC GCGGGATCAT CCTTTCCGGC CTTTGCGGGG TCATCTACGA ATGCCTGGTC 
TACTTCTCGC TCTACCCGGA TGTTCTTGCA CTCTGGTCGG CTACCGCCCA GGCCATCCTT 
TTTATCTGCA TCGCGCTTGC CGTGGCTTAC TTCACCAACC TGATCCGGGT ATCCGAGGCC 
CGGTACCGGA GCATCTTTGA AAATTCCCTT CTCGGGATCA TCCTTTTTGA CAAGAACCGG 
TTTACGATCC GGCTTGCAAA CCAGCAGGTG GCAACCATGC TCGGATATGA GGCAGAGGAA 
CTGGGCGGGA TTGCATTCTC CGATCTCTTC TTCTCGCAGG ACTTCAAACG CAGGTTCTTT 
GAGCACCTTG GATCCGGTGA GGATATCAGG AATTTCGAGA CCTGTTTTGT CACAAAGGAC 
AAAAGGCCAC ACTGGGTCAA CCTTTCCTGG AGCCGGATCG ATGACACCAT CGTGAGCTGC 
TCAATCACCG ATATTGACGC GGAGAAATCT GCACGGGAAC TTGCGGCAGA CAGTTCGATC 
CAGTACCGCC AGGTGACCGA AAACTCGCCC ACAGGTATGG TGATCACGGA TCGCACCACA 
ATCCTCTTTG CAAACCCGGC GTTTTTTTCC TTCTCCGGCT ATGGGCAGGA AGAATGCTCC 
GGGATGAATC TTGCCGATCT GGTCATTCCT GAAGACAAAG ACCGGTTCCG GTCGTTTTCT 
GATCGCTGGG GGTTTCTGGA GCCTGCCCCT GATCGTGATG AATTCCGGTT TCTCACCAAA 
AACGGGGAGA CAAGGAGGGC TGTGCTCTAC TTTACCCCGA TTATCCGGAA TAACCGTCCT 
GCGGGACTCG TCAATATCAT TGACAATACC GAATGGGAGG AATACCGCGA ACGGGTGGAG 
CAGACCAAGG AGCGGAGGCG CGAGATGATG CGGGCGGTTG CCCACGAGCT GCGGACCCCA 
CTCCAGCCGG TGCTCGGGTA CCTTAACCTC CTTCTCCAGG ATCCTCCCGC TTTTGGGGTG 
ACCGAGGAGA CCCGGCAGAT CCTTGAACGG TGTGCAAAGA GCGTGGACCG CGAGCGCCAG 
ATCATCAACC AGATGCTTGA ACTCTCGGTT CTCGAAGAAG AGGAATCCAG CCTTGACTAC 
TCGGTCTTTC CCGTTGCCGG TATGATAAAC AACGTAATCT CAGGAGGCGG GTATGCACTC 
AAGGCAGAGA TCGCAGTTGA TGTCCCGGCA GATCTTCTTT TTGATGCAGA TCGCCAGAAA 
CTCAGCTACG TTATCGATGT GCTGGTGGCA AACGGGGTGG CATATTCCAA GCCGCCACGG 
AAGATCTGGA TTACGTACCG CGACTCGCCA TCGCACCCTT TCCACCGGCT TGCTATCCAG 
GATAACGGTG TCGGGATCAC TGAAGCCCAG CTTGATGAGA TCTTCAAATC CGACGGAGGA 
ACCGGGCCGG CACGTGAAGG TGTCGGCGGT ACTGGCCTTT CACTTGCCAT TGCAAAAAAG 
TATGTCCAGC TGCATGGGGG ATATATCAGC GTGGACAGTA TGGTAAACAT CGGGAGCACC 
TTTACCCTCC ATATCCCCAA AAAACGACCT GACGGGACGG AATTACCATG A

Protein sequence

MERQVTLRGY SFSHTDLVRS IVIASLTVSV ILITALALAK NAGDLYPQLF YFPILYATYF 
YPKRGIILSG LCGVIYECLV YFSLYPDVLA LWSATAQAIL FICIALAVAY FTNLIRVSEA 
RYRSIFENSL LGIILFDKNR FTIRLANQQV ATMLGYEAEE LGGIAFSDLF FSQDFKRRFF 
EHLGSGEDIR NFETCFVTKD KRPHWVNLSW SRIDDTIVSC SITDIDAEKS ARELAADSSI 
QYRQVTENSP TGMVITDRTT ILFANPAFFS FSGYGQEECS GMNLADLVIP EDKDRFRSFS 
DRWGFLEPAP DRDEFRFLTK NGETRRAVLY FTPIIRNNRP AGLVNIIDNT EWEEYRERVE 
QTKERRREMM RAVAHELRTP LQPVLGYLNL LLQDPPAFGV TEETRQILER CAKSVDRERQ 
IINQMLELSV LEEEESSLDY SVFPVAGMIN NVISGGGYAL KAEIAVDVPA DLLFDADRQK 
LSYVIDVLVA NGVAYSKPPR KIWITYRDSP SHPFHRLAIQ DNGVGITEAQ LDEIFKSDGG 
TGPAREGVGG TGLSLAIAKK YVQLHGGYIS VDSMVNIGST FTLHIPKKRP DGTELP