Gene Mboo_0993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_0993
Symbol
ID	5411670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	972617
End bp	973525
Gene Length	909 bp
Protein Length	302 aa
Translation table	11
GC content	62%
IMG OID	640868219
Product	formylmethanofuran--tetrahydromethanopterin formyltransferase
Protein accession	YP_001404154
Protein GI	154150536
COG category	[C] Energy production and conversion
COG ID	[COG2037] Formylmethanofuran:tetrahydromethanopterin formyltransferase
TIGRFAM ID	[TIGR03119] formylmethanofuran--tetrahydromethanopterin N-formyltransferase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.945463
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.149431
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAGGTG AGCGGACCAT GGAGATCGGC GGGGCCGTTA TCCTTGACAC CTTTGCCGAG 
GCATTCCCGG TCTGGATTTC AAGGGTCCTT GTGACCGCGG ACACTCCCGG GTGGGCGCTT 
GCTGCCGCCG CCGAGGCAAC GGGGTTTGCA ACATCGAAGA TCGCCTGCCC CTGTGAGGCC 
GGAATCGAGC GGCCCCTTGC CCGGGGCGAG ACCCCGGACA AGCGGCCCGG ATACTCAATC 
CTGATCTGTA CCGAGAAGAA GGAGATGAAG GCGCAGGTTG CCGCACGGGT CAGCCAGTGC 
ATCCTTCCGG CCCCGACCGC GTCCGCATTC GACGGGCTTC CCGCTGCAAA GGACCGGTTC 
TACACCCGGA TGCATTACTT TGGCGACACC TACGAAGAGC GATGTGTGGT CGGCGGCCGG 
CAGTGCTGGA AGATCCCGGT GATGGAAGGC TGGTACACCG GCGAGGAGCG CTTCGGGCTT 
ATGAAAGGGA TTGCCGGCGG GAACTTCCTT GTCATGGCAG AGGACCGGGC TGCGGCACTT 
TCCGGGGCAG AGGCGGCGAT GGCAAAGGTC GCCGGCACGC CCGGGATAAT CGCAAGTTTT 
CCCGGAGGGA TTGTCGGGAG TGGATCGAAA GTCGGGTGTA AGAATTACCG GTTCCCGATG 
CCGGCAAGCA CGAACCACCG CTGGTGCCCG GCGCTTAAAA ATAAAATTCC GGACTCGCTT 
GTCCCTGACG GCGTGGGCGC GGTATACGAG ATCGTGATCA ACGGCTTTGA TGAGGCCGCA 
ATTGCCGGGG CAATGCGTGA GGGAATCCGG GCTGCCGCGG CAACCGGAAA GGTCAGCTGC 
ATTGGTGCCT CGAACTTTGA GGGAAAACTC GGGCAGACCC GGATAAACCT TCACGCACTT 
TTCTCCTGA

Protein sequence

MGGERTMEIG GAVILDTFAE AFPVWISRVL VTADTPGWAL AAAAEATGFA TSKIACPCEA 
GIERPLARGE TPDKRPGYSI LICTEKKEMK AQVAARVSQC ILPAPTASAF DGLPAAKDRF 
YTRMHYFGDT YEERCVVGGR QCWKIPVMEG WYTGEERFGL MKGIAGGNFL VMAEDRAAAL 
SGAEAAMAKV AGTPGIIASF PGGIVGSGSK VGCKNYRFPM PASTNHRWCP ALKNKIPDSL 
VPDGVGAVYE IVINGFDEAA IAGAMREGIR AAAATGKVSC IGASNFEGKL GQTRINLHAL 
FS