Gene Mboo_2039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_2039
Symbol
ID	5411166
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	2114379
End bp	2115770
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	59%
IMG OID	640869281
Product	hypothetical protein
Protein accession	YP_001405196
Protein GI	154151578
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.217007
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.109783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGATGGG TGCTTGCAGG TATACTCCTG TTGCTGCTCA TAGCGGGCGC GTATGCAGAC 
AATTCAGGCA GTTCCAGCAG TACCTCAGGC ATTTCCGGCA GCAGTTCGTC AGGTACTTCC 
AGCAGTTCGT CAACGAGCAC GTCTGCCTCC ACGGTCGATC AGGCAGCGCT GGTCTATGTC 
TCCAATGTGA CCACGGACAG CGGGTCGTAT TTCCCCGGCG ATTCCGGGAC GGTCTCGGTC 
ACCCTGACCA ATGGCGGGAC AACGGCAATC GGGCTGGAGG ATCCGACCCT GATCAGTCCC 
CACCTCGATA TCCAGAAAAG CGACTGGGAG GGCATGACCT ATGTGGGTGC CGGGGATACC 
ATCACGTATT CCATCCGGTT CACGGTTCTG CCGCCGGATG GGACGTACGA CGCCCTGTTT 
ACGGTCGGGA CACAGGGAGG CAACGCCATC CACTATCCGG TCGAAATCAA CGTAGACTCC 
AATAGCCTTC TTGCCGCGGT TACCTCCCAG CCTACCTCAT TTGCACCCGA GGCAGAGCAG 
AACGTGACGC TCACCCTGAT GAACACCCGC TGCGGCGCGA TCAACAACAT CGTGATCACA 
CCCGAAGGGA CCGGTATTGT TGCCGACCCG GCCATGTACC TCATCCCCGC TCTTGCGTCC 
TCCAGTTCGT ACTCGGACAC CTTCGGCATC ACCTCCCACC AGGCATCAAA CCTCACGTTT 
AACATCAGTT ACCAGGATGG CGACAACACC CATTACACGG ACGTGGTGCT GCCGATCAAT 
ATCGGTGAGG ACAAGACTGC CGCGGTTCCC GTCCTTAACG ATGTGGCACT CACCACCTCA 
GGATCGGGAT ATGACATCAC CGGGGATATC ACCAATGCCG GGATCTCGGA TGCCTACGGG 
GTGATCGTAA ACGTTGCTTC CCCGGCAACC GGCACCGGGA CCTATCCGGT CTATGCCATT 
GGCAGCATCG CCTCCGACGA TTCCGGGACC TTCGAGCTGA CCTTTACGAC AAGCGATCTC 
TCCGCCGTGC CCGTGGTCAT TACCTGGAAG GATGCTGCGG GCAACGATTA CAGCCTCACC 
AAGACCCTCA ACCTTGGTTC GTCTGCCGGA GCAGCCAACG TAACGGCGGG CAGTGGCTCG 
CGGGTGACTT CAGGAACCGG AACGGGCGGG AACTTTAATG GCGGTACCGG AGGCACGAGT 
CGTGGCGGCT ATGGCGGAAG TTATGGCGGG CGCAGCAGCA GCAACAGCCT CTTTGGCGGG 
ATCACCAGCG GCAGGGGCGC CGGGATTGCG GCATTCTATC CCCTCATTGC CGGTGTCGTG 
TTCCTGATTG CAGCGATCGT CCTGTGGACC AAGCGGAAAT GGATCATGAT CAAGCTGAAA 
AAACAGCAGT AG

Protein sequence

MRWVLAGILL LLLIAGAYAD NSGSSSSTSG ISGSSSSGTS SSSSTSTSAS TVDQAALVYV 
SNVTTDSGSY FPGDSGTVSV TLTNGGTTAI GLEDPTLISP HLDIQKSDWE GMTYVGAGDT 
ITYSIRFTVL PPDGTYDALF TVGTQGGNAI HYPVEINVDS NSLLAAVTSQ PTSFAPEAEQ 
NVTLTLMNTR CGAINNIVIT PEGTGIVADP AMYLIPALAS SSSYSDTFGI TSHQASNLTF 
NISYQDGDNT HYTDVVLPIN IGEDKTAAVP VLNDVALTTS GSGYDITGDI TNAGISDAYG 
VIVNVASPAT GTGTYPVYAI GSIASDDSGT FELTFTTSDL SAVPVVITWK DAAGNDYSLT 
KTLNLGSSAG AANVTAGSGS RVTSGTGTGG NFNGGTGGTS RGGYGGSYGG RSSSNSLFGG 
ITSGRGAGIA AFYPLIAGVV FLIAAIVLWT KRKWIMIKLK KQQ