Gene Mboo_2106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_2106
Symbol
ID	5410640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	2178388
End bp	2179389
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	59%
IMG OID	640869351
Product	flap endonuclease-1
Protein accession	YP_001405263
Protein GI	154151645
COG category	[L] Replication, recombination and repair
COG ID	[COG0258] 5'-3' exonuclease (including N-terminal domain of PolI)
TIGRFAM ID	[TIGR03674] flap structure-specific endonuclease

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGTAG CACTACGGGA TATCCTTGCC GATTACAAGA CCCCGGTCAC CTGGGAGGGA 
CTCTCCGGGG TGGCGGCGGT TGATGCAAAC AACACGCTTT ACCAATTCTT AACCATCATC 
CGACAGCCGG ACGGAACGCC GCTGATGGAC GCCAAAGGCC GGGTCACCTC CCATCTCTCG 
GGGATACTTT TTCGGATGGT CAACTTCCTT GAAAAAGGGA TAAAGCCGGT CTTTGTCTTT 
GACGGGAAAC CGCCCGAGCT CAAGCAGGAA ACGAACGCGG AGAGAAAGAA ACTCCGTGAC 
GAGGCGGGGG AGAAGTACAA AGAGGCAGTT GAGCGGGGCG ATGAGGAGGA GGCATACAGG 
CAGGCCCGGT CAGCGACCCG GGTGGATGAA ACCATTATTG CAACCTCAAA GGAGCTCCTC 
GATCTCCTGG GAATTCCGTA CGTGCAGGCT CCTTCAGAAG GCGAGGCGCA GGCGGCATTC 
ATGGTGCAGC GGGGCGATGC ACGCTTTGCA GTCTCGCAGG ACTACGATAC CCTGCTCTTT 
GGCGCACCGC TCCTGATGCG CAACCTTACC GTGAGCGGGA AGCGCAAGAT CCGGGGCCGA 
GCCGTAACTG TCAATCCCGA ACGCCTCGTG CTTTCCGAAG TGCTCTCCGG CCTCTCCCTG 
ACCCGGGAGC AGCTTGTGGA AGTCGGCATC CTGGTCGGAA CCGATTTTAA CCCGGGTGCG 
GCCGGTGTGG GGGCAAAGAC CGCACTCAAG ATTGTAAAGA GCGGGGGGTT TGCCCAAAAA 
CTCGCCGAGA AGTGCCCGGG CTTTGACCCG GCGCCAGTGG CCGACTTTTT CCTGAAGCCG 
CCGGTGACAA CGGAGTACGA GCTTGCGTGG GGCCACCCGT GCGTGGAGGG GATCAAAAAG 
ATGCTTTGCG ACGGGTACGA CTTTGCCCCG GAACGGGTTG ATGCGGCACT CGAACGCTAC 
TCGGCAAAGG CAGGTCAAAA GACGCTGGAA AGCTTTTTCT AA

Protein sequence

MGVALRDILA DYKTPVTWEG LSGVAAVDAN NTLYQFLTII RQPDGTPLMD AKGRVTSHLS 
GILFRMVNFL EKGIKPVFVF DGKPPELKQE TNAERKKLRD EAGEKYKEAV ERGDEEEAYR 
QARSATRVDE TIIATSKELL DLLGIPYVQA PSEGEAQAAF MVQRGDARFA VSQDYDTLLF 
GAPLLMRNLT VSGKRKIRGR AVTVNPERLV LSEVLSGLSL TREQLVEVGI LVGTDFNPGA 
AGVGAKTALK IVKSGGFAQK LAEKCPGFDP APVADFFLKP PVTTEYELAW GHPCVEGIKK 
MLCDGYDFAP ERVDAALERY SAKAGQKTLE SFF