Gene Mboo_1413 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1413
Symbol
ID	5412015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	1442248
End bp	1443243
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	60%
IMG OID	640868647
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_001404574
Protein GI	154150956
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0720065
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.131563
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGTCA ACCTGATGCA CGGTGCCGGG GGAGAAGTAA TGGGCGAACT CCTGCAGACG 
CTCACAAAAT TCTCCCACAA CAATGCCGGC GGGATCGGAT TAGAGTCCCT TGACGACGGG 
GCCGTAATTC CGATCAACGG TACAAACATT GTTTTTACTA CGGACTCCCA CGTGGTCCGC 
CCGCTCTTTT TCCCGGGCGG GGACATCGGG AGGATATCGG TCTGCGGTAC CGTGAACGAT 
CTTACCATGA TGGGGGGCCG GCCGGTGGCA CTCTCGTGCG GGATGGTGAT CGAAGAGGGT 
TTCGATGTGG CCGATCTCGC CCGGATCGTT GCTTCGATGG ACGAGGCGCT GGGGGAAGCC 
GGGGCATGCC TTGTAACCGG CGACACAAAA GTGGTTGAAC GGGGATCGCT TGACGGGATT 
GTTATTAACA CCGCAGGGAT TGGTGTTGCA AAGACCGTTG TACGGGACAA CGGACTTGTC 
CCGGGTGATG TGATCATCGT TTCGGGGACG CTGGGCGATC ATGGGATCGC GATCATGGCC 
CACCGTGAGG GCTTCGATCT TGGCGAGCAG ATCCATTCCG ATGTTGCCCC GCTGTGGGGA 
ATGATGGAGG GGGTTCTTGC CGCCGGCACC ATCCACGCGA TGAAGGATCC GACACGGGGC 
GGGTTTGCCA GTGCCATCAA CGAGATGGCC AAAAAGAGCC GGGTTCAGGT AAGGATCGAA 
GAGGACCGCA TCCCGCTGCG CCGGAGCGTG AAGAGTGCGG CAGGGATGCT CGGGATCGAT 
CCGCTCGAAG TGGCAAACGA AGGAAAGGTC GTAATGGGAG TGCCGGCAGC CGATGCAGAT 
GCGATCCTCG CCGCACTGCA CTCACACAAA TACGGCAAAG ATGCAGCAGT TGTCGGCAGG 
GTGGTTGCCG GGTCCCACGT GATCATGGAG ACGGCGATTG GCGGCGAGCG GTTCATCGAG 
CCGCCCATGG GCGATCCGGT GCCCCGGGTC TGCTGA

Protein sequence

MKVNLMHGAG GEVMGELLQT LTKFSHNNAG GIGLESLDDG AVIPINGTNI VFTTDSHVVR 
PLFFPGGDIG RISVCGTVND LTMMGGRPVA LSCGMVIEEG FDVADLARIV ASMDEALGEA 
GACLVTGDTK VVERGSLDGI VINTAGIGVA KTVVRDNGLV PGDVIIVSGT LGDHGIAIMA 
HREGFDLGEQ IHSDVAPLWG MMEGVLAAGT IHAMKDPTRG GFASAINEMA KKSRVQVRIE 
EDRIPLRRSV KSAAGMLGID PLEVANEGKV VMGVPAADAD AILAALHSHK YGKDAAVVGR 
VVAGSHVIME TAIGGERFIE PPMGDPVPRV C