Gene Mboo_1214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1214
Symbol
ID	5410386
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	1232890
End bp	1235061
Gene Length	2172 bp
Protein Length	723 aa
Translation table	11
GC content	56%
IMG OID	640868441
Product	hypothetical protein
Protein accession	YP_001404375
Protein GI	154150757
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1331] Highly conserved protein containing a thioredoxin domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.372382
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.0723033
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAAAG GACGATGGAA CCGTATGCAG CCCGGAGAAT ACCCGGACAC TCATAATTCA 
GGCACCATGC AAACGCGCCG GTCATCCAAT CGTCTGGCCC GTGAGACAAG CCCGTACCTG 
CTCCAGCATG CGTCCAACCC GGTGGATTGG TACCCCTGGG GAGGGGAGGC ATTTTCCCGT 
GCCAAACGTG AAGACCGGCC ACTCTTCCTT TCTATAGGAT ACTCTGCCTG CCACTGGTGT 
CATGTGATGG CACGGGAATC TTTCGAGAAC AACGAAGTTG CCGGAATTCT CAACAAACAT 
TTTGTCTGCA TCAAAGTGGA CCGCGAGGAA CGCCCGGATG TCGACAGCGT GTACATGGGG 
ATCTGCCAGC AGCTGACCGG GCAGGGGGGC TGGCCGCTTA CCATTATCAT GACACCGGAG 
AAAAAACCGT TCTTTGCCGG GACATATTTC CCCAAAACCG GCAGGGCCGG GATGCCGGGG 
CTTACGGATA TTCTCATCAC TATCGCCAAT CTTTGGGAAA CAAGACGTGA TGAACTGTAT 
GCAGCCGCGG AACAGATCCT TTCTGATGCA CACCTTTTGC ACAAAAGCCC GTCAGGGGAT 
CCGGACCGGC ACCTGCTGGA TAAAGGCTTT CGGGAACTTG CTGCGCAGTT CGATTCTGCA 
AATGGAGGGT TTGGCCGCGC ACCGAAATTT CCGGCTCCCC ATAACATACT ATTCCTCCTC 
CGGTACTGGC AGATGACAGG TGAGAACCGG GCGCTTGATA TGGCAGAGCA GACACTGGAT 
GCGATCAGGC AGGGTGGGAT CTGGGACCAT GTCGGAGGCG GCATGCACCG GTATGCAACC 
GATGCCCGTT GGCTCGTCCC GCATTTTGAG AAGATGCTCT CTGATCAGGC AATGCTTGTG 
CTTGCCAGCA CTGAAGCGTA TGCTGCAACC GGAAAGATCC GGTACCGCAC CATTGCCGAG 
GAATGCATTG CCTACGTACT CCGCGAACTA CGGGATCCCG GGGGAGGGTT TTACACTGCC 
GAGGATGCTG ACAGTCCGGC AGGAGAAGGG GCATACTACC TGTGGACAGA AGAGGAGATC 
GCCCGGATTC TTGGCCTGGA CGCTGCATTC GCATCCATCC TGTTTTCGTT GACGCCGCTT 
CCCGGTTCCG AAAAACACGC CAGTATTATT TCTGCTGCCG GGCCGGACCC GGTTCTCCTG 
AAAAATCTTG GGATCACAGA GCAGGAACTT ATTTCCCGCC GGGCTGGTAT CTTACGCCGG 
CTCGCACACG AGCGGGAGAA GCGTCCTAAA CCGGCCCGTG ACACCAAGAT CCTGACAGAC 
ACAAATGCCC TCTTCTGCAC TGCCCTTGCC CGGGCCGGCC GGGTATTGGG AAATCCTTCA 
TACACCGATG CCGCAGCCTG CACCCTCCGG TTTCTCCTGC AAAATATGAG AAATGGTGAG 
GGCAGGATCC TGCACCACTC CGGTGGAGGA GAACATGCAG TTCCCGGTTT TGCTGATGAT 
TATGCGCACC TTGTCGCTGC ACATATTGAA CTTTACAAGG CAACATCCGA CATTGCCTGT 
ATCAAAGAAG CCGTTACGAT CAATGCCCTG CTCCTTACGC ACTACCGTGA CAAAGAGGGC 
GGGGGATTTT TTACTACTGC GGATACCGCT GTGGATCTGC CGGTGCAAAA AAAAGAATGG 
TATGATGGCG CAGTCCCGTC AGCCAACACG ACCGCCTTTG AAAATCTCAC CGCTCTTTAC 
CGGCTCACCG GCAATGATGT ATTTAACGAA GCGGCGCTTG AGTGCGCCAG GTTTATCACC 
GGTGCTGCTT CCAGGGCACC CCATGCGGTC ACCGGGTTCC TTGCAGCGCT CGCATGTTCC 
CCCTTAACTG GAAATACGCA GGATCTTGTG ATTGCCGGTG ATCCAGCAAA TGCCGGCACG 
CAGACCCTGC TTGCCGTGGC ACGCAGGCAG TACCTCCCCG GTCTGCTTAT CCTGCTCCGG 
CCACCGGGCA AAGCCGGCGA TGAAGTGGAT ACAGTTTTTC CGGTTGTACA GGGCAAAGTT 
CCTCATGAGG GAAAGGCAAC TGCATATCTT TGTACCGGTT TGGCGTGTCT GCCCCCGGTA 
AGCGATCCGC AGGAACTGGT AAATCAACTC TCCATGCGGG ATAAAAAAAA CCGGCCCCTA 
AACAAAGGTT AG

Protein sequence

MGKGRWNRMQ PGEYPDTHNS GTMQTRRSSN RLARETSPYL LQHASNPVDW YPWGGEAFSR 
AKREDRPLFL SIGYSACHWC HVMARESFEN NEVAGILNKH FVCIKVDREE RPDVDSVYMG 
ICQQLTGQGG WPLTIIMTPE KKPFFAGTYF PKTGRAGMPG LTDILITIAN LWETRRDELY 
AAAEQILSDA HLLHKSPSGD PDRHLLDKGF RELAAQFDSA NGGFGRAPKF PAPHNILFLL 
RYWQMTGENR ALDMAEQTLD AIRQGGIWDH VGGGMHRYAT DARWLVPHFE KMLSDQAMLV 
LASTEAYAAT GKIRYRTIAE ECIAYVLREL RDPGGGFYTA EDADSPAGEG AYYLWTEEEI 
ARILGLDAAF ASILFSLTPL PGSEKHASII SAAGPDPVLL KNLGITEQEL ISRRAGILRR 
LAHEREKRPK PARDTKILTD TNALFCTALA RAGRVLGNPS YTDAAACTLR FLLQNMRNGE 
GRILHHSGGG EHAVPGFADD YAHLVAAHIE LYKATSDIAC IKEAVTINAL LLTHYRDKEG 
GGFFTTADTA VDLPVQKKEW YDGAVPSANT TAFENLTALY RLTGNDVFNE AALECARFIT 
GAASRAPHAV TGFLAALACS PLTGNTQDLV IAGDPANAGT QTLLAVARRQ YLPGLLILLR 
PPGKAGDEVD TVFPVVQGKV PHEGKATAYL CTGLACLPPV SDPQELVNQL SMRDKKNRPL 
NKG