Gene Mboo_2023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_2023
Symbol
ID	5411828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	2096061
End bp	2097377
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	64%
IMG OID	640869265
Product	nickel-dependent hydrogenase, large subunit
Protein accession	YP_001405180
Protein GI	154151562
COG category	[C] Energy production and conversion
COG ID	[COG3259] Coenzyme F420-reducing hydrogenase, alpha subunit
TIGRFAM ID	[TIGR03295] coenzyme F420 hydrogenase, subunit alpha

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.113638
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGGG TCATTTCCAT CTCGCCAACG ATACGCCATG AAGGTAAGTC GGGACTCGTC 
CTGGATGTTG ACGAAAAGGG GATTGTTACC CGGGGGGACT GGGTCGGGTT GTCACCGGTC 
CGGGGGATCG AGCGGTTCTG TACCGGAAAG AAGATGCACC AGGTACCAAA GATTGCCTCC 
CGGACCTGCG GTATCTGCCC GGTGCCCCAT GTGCTCGCGG GCGTCGGGGC CATGGAAGCC 
TCGATCGGCT GCGAGGTCCC AAAAGACGCT CTCCTCCTGC GCAGGATCAT CCATAGTGCG 
TCGCGCCTCT CGGTCCATGC CCTCCACGCC TTTATGGTGC TCCCGGACCT GTATTACCCC 
GGCACCGATA CCCGGATCAA CCCATACTCC CCCGAGCCCC GGGCCCGCGC CATCGCAGAC 
CGGATCCAGC GGATCCGGGA GATCGGGCAG GACTGCGTGC AGATAGCGGG CGGCGAGGCG 
ATCCACCCGG GCAACCCCCG GGTGGGCGGG ATGTACCGCA ATATCTCCCC GCAGGCAAAA 
ACAAAACTCT TCGATCTGGC AAAAGAGGGA AATGTCCTTG CCCACGAACA CCTGGACTGC 
ATGCTTGCCC TGATCCGGGA TTTTTCCCGG CGGGAGTGGG TGGAGATCGG TGGCGCCCGG 
GTGCCGGTCC CAAAGAACCT CGGATACCAC AACCAGGGCT ATCTTGCCAC GGACCCGCTG 
TACGGCACCT CAAGCCTTGA GGAGCACCCG TCCTTTGACC TTGCACGGTA TGCGGAAGTA 
TCGCCTGAAC ACTGGTACCG GGGGCCGGGG GAGGTTACGT ACGGGGATCC CACCTATCCC 
GGGGGCGGGA CGTTACCTGA GGGGACCGCG TTTGATCCCG CACGGGAGAT GTGCCCGGCC 
GTGCCCATCT ATGACGGGCA GCCGGTCGAG GTCGGGGCTG CGGCACGGCT CCGGCGTTTT 
TCGAATTTTG ACGAGAAAGG CACGATCGGG CAGCTCGTGG CCCGGCAGAT GGAGTGCATC 
CCGGCCGTAA CCGAACTGGA GGACTGCATT GACCGGCTCA ATCCCGCAGG GGCAGTCCGT 
GCGGGCACAC TTCCCCCCGG CGACGGGAAG CCGGGCTGGG CAGCAAACGA GGCCCCCCGC 
GGGACACTGG TCCACATCAC CCGGGTCAAG GATCGGAAGG TCCGGTTCTT CAAGATGATC 
GTTCCCACGT CATGGAACAT GCCGACCGCC GGCCTTGCGC TTGCCGGTTC GCCCTGGCAG 
CTTGCCGAGT TTGTTATCCG GGGCTACGAC CCGTGCATAT CCTGTGCGTC GCACTAA

Protein sequence

MTRVISISPT IRHEGKSGLV LDVDEKGIVT RGDWVGLSPV RGIERFCTGK KMHQVPKIAS 
RTCGICPVPH VLAGVGAMEA SIGCEVPKDA LLLRRIIHSA SRLSVHALHA FMVLPDLYYP 
GTDTRINPYS PEPRARAIAD RIQRIREIGQ DCVQIAGGEA IHPGNPRVGG MYRNISPQAK 
TKLFDLAKEG NVLAHEHLDC MLALIRDFSR REWVEIGGAR VPVPKNLGYH NQGYLATDPL 
YGTSSLEEHP SFDLARYAEV SPEHWYRGPG EVTYGDPTYP GGGTLPEGTA FDPAREMCPA 
VPIYDGQPVE VGAAARLRRF SNFDEKGTIG QLVARQMECI PAVTELEDCI DRLNPAGAVR 
AGTLPPGDGK PGWAANEAPR GTLVHITRVK DRKVRFFKMI VPTSWNMPTA GLALAGSPWQ 
LAEFVIRGYD PCISCASH