Gene Mboo_1969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1969
Symbol
ID	5410261
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	2031608
End bp	2032786
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	53%
IMG OID	640869209
Product	metal-dependent phosphohydrolase
Protein accession	YP_001405126
Protein GI	154151508
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.883701
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTAAAGC AGAGAGATCA GGACCCGGAT CGCAACGCAG CAATTTTCCG GTACACACGC 
GAACGCGAGG CTCTTCTCTC TCCTCGTGCC TCGCGCAGCG ACCAGGCGCT GAGACGCAAG 
AGCCGCAAGC CGGAAGATAT ACGCACCCCG TACTCCCGGG ACGCGGACCG AATCCTCCAT 
ACCCGGGCGT ACACGAGGTA CATTGACAAG ACTCAGGTTT TTTACCTTGT TGAAAACGAC 
CACATCACCC ACCGGGTTAT CCATGTCCAG CTCGTTTCGA AGATCGCCCG CACGATCGGC 
CGGTGCCTGC GCCTCAACGA AGACTTGATC GAGGCGATCG CGCTCGGACA CGATATCGGT 
CACATACCTT ATGGGCATTT CGGCGAGGCC TGCCTTTCGG ACCTCTGCCT GGAGCACGGG 
ATCGGGAAAT TTGCCCATAA CGTTCAGAGC GTAAGATCCC TGGACAGGAT TGAGGATCAG 
GATCTGACCA TGCAGGTACT GGACGGGATC CTTTGCCATA ACGGGGAAGC CGAGGATTTG 
CGTATGTCCC CGGAATCCTG CCCGGACTGG GCAACTTTTG ATCGGAAAGT CTGCGCAAAC 
GAGACAGGTG GGCGGCCTGG ATCTCCGATG ACTCTTGAGG GATGTGTGGT AAAATTTGCC 
GATACGATTG CATATATTGG CCGCGATCTC CAAGATGCAC AAGAAGTCGG GCTTATTAAA 
AATCCCGGTG AGATTCCGCA GGAATGCCAA GAGGTATTTG GATCAGATAA CCGCGCTATA 
ATCGATACCC TGATTCGTGA TCTACTGGAG AACAGCGATG CGGATGATAA ATGTTTTATC 
TCCTACAGCA GGGAGGTAGA ACATGCACTC GCTACACTCC GGGCATTCTC CCGGCACACC 
ATTTACAATA ACCCGAAACT GACCGCGGAG CGGGAAAAGA TCCGAACGAT GTACCGGGTT 
CTGTTCTTAA CCTATCTTTC CGATATAGAA TCCGATCGGC GCAGCTCAAA AATATTCTCT 
GATTTTATTA ATGCCCCATG GGTTAATCGG GAGTACCTTC ACACGACCCC GCCTGCCGGG 
CTCACCCGTG ATTTTATTTC CGGGATGACC GATCGCTATT TCCTGAAACG ATTCGAGGAT 
TGTGTAATTC CCCACAGAAT CGAAGGGGCA TTTCGGTGA

Protein sequence

MVKQRDQDPD RNAAIFRYTR EREALLSPRA SRSDQALRRK SRKPEDIRTP YSRDADRILH 
TRAYTRYIDK TQVFYLVEND HITHRVIHVQ LVSKIARTIG RCLRLNEDLI EAIALGHDIG 
HIPYGHFGEA CLSDLCLEHG IGKFAHNVQS VRSLDRIEDQ DLTMQVLDGI LCHNGEAEDL 
RMSPESCPDW ATFDRKVCAN ETGGRPGSPM TLEGCVVKFA DTIAYIGRDL QDAQEVGLIK 
NPGEIPQECQ EVFGSDNRAI IDTLIRDLLE NSDADDKCFI SYSREVEHAL ATLRAFSRHT 
IYNNPKLTAE REKIRTMYRV LFLTYLSDIE SDRRSSKIFS DFINAPWVNR EYLHTTPPAG 
LTRDFISGMT DRYFLKRFED CVIPHRIEGA FR