Gene Mboo_1061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1061
Symbol
ID	5410897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	1047960
End bp	1049270
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	52%
IMG OID	640868287
Product	S-layer-like domain-containing protein
Protein accession	YP_001404222
Protein GI	154150604
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1361] S-layer domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.196734
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATACCTA CACTCATGAG AAGACATAAA GGACGGATTA TCATACTCCT CCTTGTTCTT 
GCGGCATTTC TTGTCTCGCC GGCGTTTGCG GGGACGAGAT ATTTCGAAGG AAGCCCGAAT 
CTGACGGCAT ATGTTAGTGG CGCAAACCAG TTTGCACCAG GAAGTTCCAT CCAGATCCCG 
GTGGTGATCA AGAACACGGG AATAAATACG TATTACGAGG TGGCATCAAA TATTGTCGAC 
CGTGCGGATG TCCCCACAAC GGCGAAGTTT GTGACAGTTG CGATGGGTGC GGGAAATGCA 
CCTGTAGTTA TCAAGACTGA CCCGCAGATG ATCGGTGACA TCGCAAGCCA GGACCAGCAG 
ACCGCTACCT TTTCAGCTAC CGTCAATGCG GATGCAGCGG GTGGCACCTA TACCCTCCCG 
CTCAACATCA CTTACCAGCA GTTTTCTCAT GTCGACCAGT ACGGGATGGA CACATTCCAG 
TATTATTATG TCCCAATGAA CGTGACACTC ACCGTACCGC TGGTCATTAA ATCAGAGGTG 
ATTCCTGAGG TGATTTCAGC GACCTCTGAC AACCTCGTCG CAGGAGCGGA CGGTTACGTG 
AACCTGACGA TTAAAAACAT CGGGTCGTTT GACGGGACCA AGGCAACCGT CCAGATTGTC 
CAGAACGATG ATAGTCCCGT CAGTCCGGTG GACAGCAACG TGTATATCGG GGATTTCCCG 
GCCGGCAGCA CCGTTTCCTG CCAGTACAAG GTGGCAGTGG CAGACACGGC TCAGAACAAG 
ACCTATCCCG TCGACGTTGT TGTGAACTAC CAGAACGACG AGGGTGATAT GGTACCCTCC 
CAGTCCCAGA CCGTGGGCAT TGATGTAGGC AACAAGGTAA ATTTTGCCAT CCAGATCTCT 
CCCATCGAGA TGAGCCCGGG AAGCAAACAC ACCATCCAGA TCGAATATCA GAATACCGGT 
GATACCATGG TTTACAGCGC ACAGGCACGC ATCAGTGTAG CCGCACCCTT TACCAGTTCC 
TCTGATGTCG CCTACCTGGG AGATCTCGCA CCGGGACAGA CCGCGGTTGC CACCTACCAG 
ATCAGTGTTG CAAGCGATGC TACCCTCAAG GAGTACGGCC TTGATTCTGA GATCCGGTAC 
AACAATGCCA TCGGCGATAC CTACGTCTCC GACCCCATGA AAGTCACCAT TGATGTACAG 
AACCTCACCG GTCTTGAGGG CATCATCTCC AACCCGGTAT ATCTCTCCCT TATCGCTGCC 
GTGATTATCG GCATCATTTA TGCTATCATC CATACCCGGA AGAAACACTA A

Protein sequence

MIPTLMRRHK GRIIILLLVL AAFLVSPAFA GTRYFEGSPN LTAYVSGANQ FAPGSSIQIP 
VVIKNTGINT YYEVASNIVD RADVPTTAKF VTVAMGAGNA PVVIKTDPQM IGDIASQDQQ 
TATFSATVNA DAAGGTYTLP LNITYQQFSH VDQYGMDTFQ YYYVPMNVTL TVPLVIKSEV 
IPEVISATSD NLVAGADGYV NLTIKNIGSF DGTKATVQIV QNDDSPVSPV DSNVYIGDFP 
AGSTVSCQYK VAVADTAQNK TYPVDVVVNY QNDEGDMVPS QSQTVGIDVG NKVNFAIQIS 
PIEMSPGSKH TIQIEYQNTG DTMVYSAQAR ISVAAPFTSS SDVAYLGDLA PGQTAVATYQ 
ISVASDATLK EYGLDSEIRY NNAIGDTYVS DPMKVTIDVQ NLTGLEGIIS NPVYLSLIAA 
VIIGIIYAII HTRKKH