Gene Mboo_2201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_2201
Symbol
ID	5411221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	2276222
End bp	2277211
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	59%
IMG OID	640869451
Product	radical SAM domain-containing protein
Protein accession	YP_001405358
Protein GI	154151740
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR03550] 7,8-didemethyl-8-hydroxy-5-deazariboflavin synthase, CofG subunit

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.524494
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCCCC GGGTGATCAC GTACACAAAG AACGTCTTTT TGCCGCTCAC CAGCGTCTGC 
CGGAACCGGT GCGGGTACTG CTCGTTCCGC ACCCCGGTTC AGGAAGGATG TGTCATGCTG 
CCTGAAGAGG TGGAAGCGGT TCTTGCGCAG GGGCAGGCGG CCGGGTGCAC CGAGGCGCTC 
TTTACCTTCG GCGAGCATCC CGAAGAAGAG GAAGGTTTTC GCGCATACCT GGAAAAGACG 
GGTTACGATA CCATCCTCGA TTACTGCGAG GCAATGTGCC GGCTTGCTCT CCGGTACGGG 
ATCCTCCCGC ACACCAACGC CGGTATCCTC ACGTATGACG AGATGAAACG GCTCCGGCCC 
ACAAACGCCA GCATGGGCCT GATGCTTGAG ACTACGGCAC GGATCCCGGC GCACCAGGGA 
TCGAAAGGAA AGGAACCGGA AGTGCGCCTT GCAATGATGG AAGACGCGGG CCGGCTGAAG 
ATCCCGTTCA CCACCGGCCT GCTCCTCGGG ATTGGCGAGA CTGCGGCCGG CCGCGAGGAC 
TCACTTATTG CAATCCGGGA CATCCATAAG AAGTACGGGC ATATCCAGGA GATCATCCTC 
CAGAATTTCT GCCCCAAGAA CAATACACCC ATGGCTGCGT TCCGGGTGCC GGATACACAG 
GAGATCTGCA ACACGATCCT GATGGCTCGC CGGATCCTGC CAGAGGAGAT CTCCATCCAG 
GTAGCCCCCA ATCTCATCGA TGCGTCCCGG CTCATTGGTT GCGGGGTCAG TGATCTGGGG 
GGGATATCCC CGGTAACCAT CGATTATGTG AATCCTGAAC ATCCCTGGCC GGCGTTCAAC 
GACCTCAAAA AGATCGTTGG GGACGCAACA CTTCAGGAGC GCCTCTGCAT CTATCCACGG 
TTCATCCGGC CGGGCTGGTA CGACCCTGGC CTGCAACCTC TAATAAACAG GCTCAACCAA 
CGTATAAGCA GAGGGAGCAG CCAACCGTGA

Protein sequence

MEPRVITYTK NVFLPLTSVC RNRCGYCSFR TPVQEGCVML PEEVEAVLAQ GQAAGCTEAL 
FTFGEHPEEE EGFRAYLEKT GYDTILDYCE AMCRLALRYG ILPHTNAGIL TYDEMKRLRP 
TNASMGLMLE TTARIPAHQG SKGKEPEVRL AMMEDAGRLK IPFTTGLLLG IGETAAGRED 
SLIAIRDIHK KYGHIQEIIL QNFCPKNNTP MAAFRVPDTQ EICNTILMAR RILPEEISIQ 
VAPNLIDASR LIGCGVSDLG GISPVTIDYV NPEHPWPAFN DLKKIVGDAT LQERLCIYPR 
FIRPGWYDPG LQPLINRLNQ RISRGSSQP