Gene Mboo_1197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1197
Symbol
ID	5411345
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	1211003
End bp	1212097
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	54%
IMG OID	640868423
Product	PEGA domain-containing protein
Protein accession	YP_001404358
Protein GI	154150740
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.258799
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.00873035
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCTCTA AAAATTTCCC GGAATTGTTT TCCTGGCTTC TTCTTGCAAT AATTCTGCTA 
TTGTGCATCG GACCGGCACA GGCCGGGACC GTTTCGATCA CGTACCGGGG AAGCGGTGGA 
TATTATGTTG GTGACAGTGT GATACTGGAC GGGATGAACA CGGTAGGCAA CACCACCGTG 
ATAACCATCA CCGGCCCGGG CCTGCCGGCT GCCGGTGTAC CTCCCTATAA CCTGACCGGC 
GACGCAGGAA CCGGGAATAC CGCGGTTACC GATCCGTCCG GGACATGGTC ATACGACTGG 
GATTCGTCAC GGGCACTGGG AGCCTCCAGT CTTAACCCCG GACGGTATAC ATTTACGGTC 
TACGACAACA GCAATTCTCA AATTAACTCC TCGGTCTCTG TCTTCCTGAA GCAACCGGAA 
TTTTATGCCT CCATATCTCC CAACCCGGCT GTTCTCAATG ATTATGTGCA GGTAACCGGA 
AAGGTGGAAT CTGCGGCAGA TACCATCGGG ATTGATGTGA TAGATGCATC CGGGAATAAG 
GTGCATACCT TTTCCTCGCC GGTCAGTAAC GGGGGGTATT TCCAGTATGG ATTCCATGTG 
GATATGCCCC CGGGCGTGTA CACGGTTTAC ATCAGCAGCC CTTCACTGTC CAACAGCCTG 
ACAAGCACCC TGACCGTGGT AGAATCCAAT GCAAACCTGA CGGCGGTTGC ACCGGTTATT 
AGCACTCAGG TTACTTCGCC TCCTGCTTCG ACCGGGACAC CTGTTGCTCC TCAGGCCACG 
GCCACAATCC CGCCGGGATC GGGGACACTG GTGATATCAT CAGTACCGGC CGGCGCTTCA 
GTCTATCTTG ATTCAGCAAA TGTCGGAATT TCGCCGGTGA CACTGAATGG CGTTGCACCC 
GGTACGCACC TTGTGGAGAT CAAGTCTCCG GGTTACCTTA CCGTGTCCAT GGATGTCGTT 
GTCACAAGTG ACAAGCCTGT TGAGGTCTCA CCCCAGCTGG TAAGGGCACC CTTTGGACTT 
GGGCTTTCTC CCCTTGCAGC GCTCGGCGGT TGCCTTGGTG CAGCAGCTTT GTTTATCGTT 
TCACGGAAGA AATAA

Protein sequence

MSSKNFPELF SWLLLAIILL LCIGPAQAGT VSITYRGSGG YYVGDSVILD GMNTVGNTTV 
ITITGPGLPA AGVPPYNLTG DAGTGNTAVT DPSGTWSYDW DSSRALGASS LNPGRYTFTV 
YDNSNSQINS SVSVFLKQPE FYASISPNPA VLNDYVQVTG KVESAADTIG IDVIDASGNK 
VHTFSSPVSN GGYFQYGFHV DMPPGVYTVY ISSPSLSNSL TSTLTVVESN ANLTAVAPVI 
STQVTSPPAS TGTPVAPQAT ATIPPGSGTL VISSVPAGAS VYLDSANVGI SPVTLNGVAP 
GTHLVEIKSP GYLTVSMDVV VTSDKPVEVS PQLVRAPFGL GLSPLAALGG CLGAAALFIV 
SRKK