Gene Mboo_1107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1107
Symbol
ID	5411267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	1104407
End bp	1105756
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	51%
IMG OID	640868333
Product	putative PAS/PAC sensor protein
Protein accession	YP_001404268
Protein GI	154150650
COG category	[T] Signal transduction mechanisms
COG ID	[COG2202] FOG: PAS/PAC domain
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.316445
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.383649
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGGAC AACCATCTCT CATGGGGGAA CGAGAAGAAA GTTTTGTAGA CCTCTGGCTG 
TTTATTATCG TTGCCACAAC CATCATTGCA ATCCTCATCA ACATTCTTGC GCTCCATTAT 
GGAACAGCGG CCGTGGCTGC AAATCTTCTC TATATCCCGA TTGTCCTTGC AGCGTACTGG 
TACCCCCGCT GGGGAATCTC GTACGCAATC GGGGTCTCTG CCCTGTTTAT TGCCATTGTC 
GCTTTCGTGA CCGGGGGTAC GGTTGCCCAG GTAGCGGCTT CCTTTGTTAC ATGCCTTGTG 
GTTATCGGGG TAGCAGCGGT TGTTTCAAGC CTTGCCATTC ATATGCGCAA AAACGAGGTA 
AAATACCGGG GTATCTTCAA CCATTCTGAG GCAGGTATCG GCCTTGTGAA TAACCCGGAT 
CATAAAGTAA ATGAGGTAAA CCGACGCTTT GCAGATACAC TCGGGTACGA GCCCGCCGAA 
ATCGAAGCAA GAACATTCGT TGACCTGTGG GCCGATGCGG CAGACCGGGA CCGGTTTTTC 
CAGCGCCTTG CCAGCCAGGG TAATGTGGAG AACCTGGAAA CCCGGTTTGT GACAAAGGGC 
GGCGCCACCC GGTGGATGCT GCTTTCTGCA GGAATGCTTC CGGATGACCA GTTTGTCTGT 
ACGATCGTAG ATATTACCGC CCGTAAGCAG GCCGAGGAAT CGCTTATTAT CAAAGATCAT 
GCGATCAGTT CCTCGCTGAA TGCGATTGCG ATTATGGATC TTGATTTTTC GATCACGTAC 
GTGAACCATT CTCTGATTTC CATGATGGGC TCCCGCAGCG AAAGGGAGTT TGCCGGCACA 
AATCTCTGGA AATGTATGGC ATCACCTCAG GAGATCGAAA AGATACGGGA CACACTCTCG 
CACAAAGGGA GCTGGCTTGG CGAGATCCTG CTCAAAAAAA CGGATCAGAC GCAGTTTTAT 
GTCATGCTTT GGATTAACCT GGTAAGGAAT GAGACCGGCA ACCCGGTCTG CATCATGGCC 
TCGTTTATAG ATATCACCGA CCGCAAGCAG ATGGAATCCG TAAAACGGCA GGCCCTGGAG 
CAGATTGAGA AGAATATCGA GCAGTTTGCC ATCCTTGGCG ATCACATCAG GAATCCGCTT 
GCTGTCATTG TCGGTCTCTC CAGTCTTGCA CCCGGGGATG TATCGGATAA GATCATCCTG 
CAGGCCCGTG AAATCGACCG GATCGTAACC CAGCTCGACA TGGGCTGGAT AGAATCGGAG 
AAAGTGAGGG AATTTATCAA GCGGTATTAC ATGGTAGGTA TCCAGGATAT CAGCGATACC 
GGTGGGGCCC GGGAAGGCCT GGTTCGCTGA

Protein sequence

MTGQPSLMGE REESFVDLWL FIIVATTIIA ILINILALHY GTAAVAANLL YIPIVLAAYW 
YPRWGISYAI GVSALFIAIV AFVTGGTVAQ VAASFVTCLV VIGVAAVVSS LAIHMRKNEV 
KYRGIFNHSE AGIGLVNNPD HKVNEVNRRF ADTLGYEPAE IEARTFVDLW ADAADRDRFF 
QRLASQGNVE NLETRFVTKG GATRWMLLSA GMLPDDQFVC TIVDITARKQ AEESLIIKDH 
AISSSLNAIA IMDLDFSITY VNHSLISMMG SRSEREFAGT NLWKCMASPQ EIEKIRDTLS 
HKGSWLGEIL LKKTDQTQFY VMLWINLVRN ETGNPVCIMA SFIDITDRKQ MESVKRQALE 
QIEKNIEQFA ILGDHIRNPL AVIVGLSSLA PGDVSDKIIL QAREIDRIVT QLDMGWIESE 
KVREFIKRYY MVGIQDISDT GGAREGLVR