Gene Mboo_2042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_2042
Symbol
ID	5411169
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	2117972
End bp	2119084
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	58%
IMG OID	640869284
Product	thiamine biosynthesis/tRNA modification protein ThiI
Protein accession	YP_001405199
Protein GI	154151581
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0301] Thiamine biosynthesis ATP pyrophosphatase
TIGRFAM ID	[TIGR00342] thiazole biosynthesis/tRNA modification protein ThiI

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.389674
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAAAA AATGGCTGGT CAGGTACTCG GAGATCTTCT TAAAATCGGA TCCGGTGCGC 
CGGCACTGGG AGCGCGTTTT GATGAACAAC ATCCGGCAGC TGATGCCGGA CGTCAGGATC 
AAGAACGAAC GCGGCCGGAT CTGGCTGACC GGTGATGCAG ACCCGGTAAA ACTGCGGCAC 
ATCTTTGGGA TTGTCTCGTT CTCCGAGGTT GAGCATGTTC CCCGCGAGGT TACCCTCGAA 
GAGGCCCTTA TCGAGTATGG CCGGGCCCAT GGACTGTCCC TGGCAAAGAC CTTTGCACTC 
CGGATAAAAC GGGTGGGAAA ACACGATTTC TCCTCAAACG ACAAGGCCAT CGAACTGGGT 
GACCAGGTAA GAAAGGCCTT CCCGCATCTC AAGGTAAACC TCGCCACTCC CGATGTGGAG 
ATCCATGTCG AGATCCGGCA GGATGAGTGC TACCTGTACG ATACCGTGAT CAAGGGGGCG 
GGCGGTCTTC CCCTCGGGGT AGAGGGAACG CTTGTTGCCC TTGTCTCGGG CGGGATCGAT 
TCTCCTGTTG CAACGTACAT GATGATGAAG CGGGGCTGTA AGATCGTCCC CATCTATGTA 
GCACTCGAGA CCTTCCTTGA CGAGACCGTG CTTGCCCGGG CCGAGCGGGT GGTAGAGATC 
CTGCGGCAGT ACCAGCCGGA CCTGAAGCTC CGGGTGATCC ATGATTCGTA CCTGGCAGCT 
GCAAAAGAGG AACTGATCCG GAACCACCAG GAGAAGTATA CCTGTCTCTT CTGCAAACGA 
CGTATGTACC GGATTGCGCA GGCCGTAGCC CAGGAAGTGG GGGCAAAAGG TATCGTGAAC 
GGGGAGTCGC TCGGGCAGGT AGCCAGCCAG ACTCTCGACA ACCTTGTTGT CCTCTCCGAT 
GTGGCGGAGA TCCCGGTGTA CCGTCCGCTT ATCGGGTTTG ACAAGGCAGA TGCCATTGCG 
CTTGCCCGCG AGATCGGAAC CTTTGAAGAG TCCACCAGTA AGGCATCCGG CTGCAAGGCG 
GTACCCAACG GGCCGTCCAC CAGGGCCCAG CTTGACGAGA TCCTTGCGAT CGAAAGTGCG 
CTGGAAGCAA CAAAGATCCC GCTGCCGGTG TAA

Protein sequence

MTKKWLVRYS EIFLKSDPVR RHWERVLMNN IRQLMPDVRI KNERGRIWLT GDADPVKLRH 
IFGIVSFSEV EHVPREVTLE EALIEYGRAH GLSLAKTFAL RIKRVGKHDF SSNDKAIELG 
DQVRKAFPHL KVNLATPDVE IHVEIRQDEC YLYDTVIKGA GGLPLGVEGT LVALVSGGID 
SPVATYMMMK RGCKIVPIYV ALETFLDETV LARAERVVEI LRQYQPDLKL RVIHDSYLAA 
AKEELIRNHQ EKYTCLFCKR RMYRIAQAVA QEVGAKGIVN GESLGQVASQ TLDNLVVLSD 
VAEIPVYRPL IGFDKADAIA LAREIGTFEE STSKASGCKA VPNGPSTRAQ LDEILAIESA 
LEATKIPLPV