Gene Mboo_1016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1016
Symbol
ID	5411752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	996825
End bp	998441
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	61%
IMG OID	640868242
Product	putative manganese-dependent inorganic pyrophosphatase
Protein accession	YP_001404177
Protein GI	154150559
COG category	[C] Energy production and conversion
COG ID	[COG1227] Inorganic pyrophosphatase/exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.597634
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGA TCTACTGCTT TGGCCATCGC CAGCCCGACA CGGACAGCAT TGCAAGTGTG 
CTCGGGTACG CGGATTTCAA AAACCGTTCC GAGCCGGGCC GGTACGTGCC GGCGCGGTGC 
GGGGAACTTA ACGGCGAGTC AAAGTTCATG CTCGAACGCT ACGGTGTGGC CGCCCCGGCG 
TTTATTCCCA CGGTCGAACC CACCCTTGCC GATATCACGT ATAAGCCGGT CTTTGCCCTT 
TCCGAGGATG TCCCGGCCGT GGACGTTGCC GCCCTCATGG CAAAGGAGGA ATTACGAAAC 
GTGATCATCA CGGACGCAGA GGGAAAACCC GCCGGGATGA TCGGGGAGCA CGCCCTTGCC 
AATGCCTACA TCGATACCCT GCACCTCGCC ACCCTTGCAG TGACACCGGT GCCTATCGGG 
ACGCTTGCAC GGATCCTTTC TGCAGAAGTC CTGGTCAGTG CTCATGCAAC GCTTGAAGGC 
CGGGTGTATA TCGCGATCGA TGCCCTGCAT GTCACTCTTG CAAAGATGAC CGAGAAGGAT 
ATTGCGGTTG TCGGGGACAA CGAGCCGGCC CAGCTCGCAC TTGTCTCGGC AGGGATCGCG 
GCGCTTATCA TTGCGGAAGG CGCGCCGGTG GGAAGCCGGG TCATTTCAGC CGCACAGCAG 
CACCGGGTCT CGGTCCTTTC CACAAAACTC GACGCGTTCG GGGTGGGCAA GATGATCAAC 
CTCGCGCTTC CCGCCCGGGC CATGATGGAG ACCAGGGTCC CGGTCCTTGC CTGCACCGAA 
ACGATCGCAA AGGCCCGCCA GGTTGTTGCT GGTTCCACGT TCCGGGCAGC GTGCGTTGTA 
TCGCCGGACG GAAAACTCCG CGGCATCCTG ACCAGGACCA CGCTGCTCGA TGACGTGCGC 
CGCCCGGTGG TTTTGCTCGA CCACAACGAG GCCTCGCAGG CAGTCCCCGG GATCGAGGAA 
GCTGACGTAG TGGAGATCAT CGACCACCAC CGTCTCGGGG CGATCACCAC GCTCCGGCCC 
ATCCGCTTCT TCAACGACCC GGTCGGGGCC ACCTCCACGA TTATTACCAT GAAGTTCCGC 
GAGGCCGGCC TTAGCCCGTC ACGGGAGATC GCAGGGATCC TGTTGTGCGG CATCCTTTCA 
GATACGCTGG GCCTGCGCAT GTCCACAACA ACCCACCAGG ATCAAACTGC GGTAAAGTAC 
CTGGCGGGGA TTGCGGGGGA AGACGCGGAA AAACTCGCAG TCGAACTCCT CGAAGCCGGC 
ATGGACCTCT CGGGCGTACC GCTTGATGCC CTCCTGGCCC GGGATACCAA GCTCTTCACG 
CTTGCAGACC GGAGCGTGGA GATCGCGCAG GTTATGGTAC CGGCCTTTGC ATGGAACCGG 
GCCCGGGACA GCGAGATTGC CGCGGCGCTT GAAAAAGCCC GGGACAAATC GGGAGCCGCC 
CTCTCGCTTG CCCTCTTTAC CAATATCCCC GAAAACGCAA GCGACCTTTA CGGGGCCGGC 
GATGCCGGGC TGCTTACGAA AGTCTTTGGC ACGCCTCTTC CCGCCCGGCT TCCCGGGGTA 
ATGTCCCGAA AAAAGGATTT TGTCCCATGG CTGGGTGAAA AACTCAGGAA GTGCTGA

Protein sequence

MTQIYCFGHR QPDTDSIASV LGYADFKNRS EPGRYVPARC GELNGESKFM LERYGVAAPA 
FIPTVEPTLA DITYKPVFAL SEDVPAVDVA ALMAKEELRN VIITDAEGKP AGMIGEHALA 
NAYIDTLHLA TLAVTPVPIG TLARILSAEV LVSAHATLEG RVYIAIDALH VTLAKMTEKD 
IAVVGDNEPA QLALVSAGIA ALIIAEGAPV GSRVISAAQQ HRVSVLSTKL DAFGVGKMIN 
LALPARAMME TRVPVLACTE TIAKARQVVA GSTFRAACVV SPDGKLRGIL TRTTLLDDVR 
RPVVLLDHNE ASQAVPGIEE ADVVEIIDHH RLGAITTLRP IRFFNDPVGA TSTIITMKFR 
EAGLSPSREI AGILLCGILS DTLGLRMSTT THQDQTAVKY LAGIAGEDAE KLAVELLEAG 
MDLSGVPLDA LLARDTKLFT LADRSVEIAQ VMVPAFAWNR ARDSEIAAAL EKARDKSGAA 
LSLALFTNIP ENASDLYGAG DAGLLTKVFG TPLPARLPGV MSRKKDFVPW LGEKLRKC