Gene Mboo_1026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1026
Symbol
ID	5411489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	1005433
End bp	1006701
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	53%
IMG OID	640868252
Product	hypothetical protein
Protein accession	YP_001404187
Protein GI	154150569
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1361] S-layer domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.441563
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.903414
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCAGA CCATACACCC ACGGGCCACT CCCGATAACG GGAAACTTTC CCCAACGGAA 
AGACCGGCCG GCCAGATGCA GGAAAGAGTG AGACAAAAAA AATTCCCCGG CTCCGTGAGC 
GGGATATTTT TGCTCCTTGC CGTTACGCTG GGGATCTTTG CGATTCCGGT GTCTGCCTAC 
CCTACGCCTT ATTCTCTCTC GGCAGATTCC AGCGTATATG TCTCTAATGT TACGTATTAC 
CCGGGCGCTT TTTTTTCCGG TGACAGCGGT ACGGTCACGT ACCAGGTGAT CAACGGCAAT 
ACCAACACGA GCATGGTGGT AAATCATGCA TCGTTCAGCG ATACCGATAT CCGGCTGACA 
AGCGGTACCT ATGATTCCTC GCAAAACATC GGTCCTCTCC AGACAGAGCC GTTTACGTTT 
TCGATTACCA CCAATGCGAG TGACGGCAAC TACTACCCCA CCTTCTCCCT TTCGTTCCAG 
GATGGCGAGT CCATGCACTA CCAAGGACTG GTCAAGGTGG ATAACCGCCC GCTGGTCATG 
ACCATCCAGG ACCAGCCGGA TGCCTATACC CAGGGAAAGA AGAACACGAT CAGCGTGCAG 
ATCGCAAACC CCCGGTCCGA CGATGTACAC AATGTGATCT TCACGGTTTC CGGTGATGGC 
GCTACACTTA CGCCATCGCA GACCTATATT GGGGACCTCC CGTCAGGAGC CATGACGCTG 
GTCAATTTCA CGGTTACACC AAATGCACCC ACCACCCTGA ACCTGGTGGT CGGTTACGAC 
AATGGCGATA ACGCACACAG CATCGATTCG ACCCTTCCAA TCCAGTTCAC CACAGACAAG 
CAGCAGGCCG ACCCGGTGAT GAGCAACATC GTTATTACCG CCAATGGCAC GGTCTACACG 
GTCAACGGTG ATTCAACCAA TGCCGGACTT TTAAATGCAA ATGGTGTAAC GATCACCGCT 
CTTTCCCCGG CAGTTCCGGA AGATCCCTAC CAGAATTACG TGATCGGGAC ACTCAAACCT 
GACGATTTCG GCAGTTTCGA ACTTACCTTC TCCGTCCCTG AGGGAACAAA GAGCATTCCC 
CTCAAGCAGT CCTTCAAGGA TAGTGACGGC AACGTGATCA CTTCAACCCA GGATATTGAC 
CTGACAACTG CCCAGCAGGC TTCGCAAAGC AATGCCGGTC CGGGAATGCT CCCGGTGCTT 
GTCGTTGTTG CCATTGTCGT GATCGGTGCG GGCGGCTACC TGTATATGAA AAAGAATCGG 
AAACAGTGA

Protein sequence

MIQTIHPRAT PDNGKLSPTE RPAGQMQERV RQKKFPGSVS GIFLLLAVTL GIFAIPVSAY 
PTPYSLSADS SVYVSNVTYY PGAFFSGDSG TVTYQVINGN TNTSMVVNHA SFSDTDIRLT 
SGTYDSSQNI GPLQTEPFTF SITTNASDGN YYPTFSLSFQ DGESMHYQGL VKVDNRPLVM 
TIQDQPDAYT QGKKNTISVQ IANPRSDDVH NVIFTVSGDG ATLTPSQTYI GDLPSGAMTL 
VNFTVTPNAP TTLNLVVGYD NGDNAHSIDS TLPIQFTTDK QQADPVMSNI VITANGTVYT 
VNGDSTNAGL LNANGVTITA LSPAVPEDPY QNYVIGTLKP DDFGSFELTF SVPEGTKSIP 
LKQSFKDSDG NVITSTQDID LTTAQQASQS NAGPGMLPVL VVVAIVVIGA GGYLYMKKNR 
KQ