Gene Mboo_2019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_2019
Symbol
ID	5411824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	2092440
End bp	2093582
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	59%
IMG OID	640869261
Product	aldo/keto reductase
Protein accession	YP_001405176
Protein GI	154151558
COG category	[R] General function prediction only
COG ID	[COG1453] Predicted oxidoreductases of the aldo/keto reductase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.0479916
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTACA GGAGATTCCC TAAGGTCCAC CAGGATATAT CGATCCTCGG GTTCGGGTGT 
ATGCGCCTGC CGGTGCTCGA AAACCAGCAG ATAAACGAAC CGCTTGCAAC AGAGATGGCG 
CGGTACGCCA TCGACCACGG TGTCAACTAC GTGGACACCG CGTACCCCTA CCACAACGGG 
GAGAGCGAAC CATTCGTGGG CCGGGCGCTT GCCGACGGCT ACCGCGAGAA AGTCATGCTC 
GCCACCAAGC TCCCGAGCTG GCTGATCACA AAACCCGGGG ACATGGACAA GTACCTCAAC 
GAGCAGCTTG CCCGCCTTGC CACCGACCAT ATCGACTTCT ATCTCGTCCA CGGGCTTAAC 
GCGGCCACCT GGAAGGCCAC AAGCGAAGCG GGTGTGCTCG ACTTCCTCGA CGATGCAATA 
GACGACGGGC GGATCCGGTA CCCCTGTTTC TCGTTCCACG CCGCCCTCCC GCTCTTTAAG 
GAGATCGTAG ATGCCTATGA CTGGACCTTT GCCCAGATCC AGTACAACTT CATGGACGAA 
CAGTACCAGG CGGGAACCGA AGGCTTGCAG TATGCGGCAA AGAAAGGCAT CGGGATCGTG 
GTGATGGAAC CCCTCCGGGG AGGGCTTCTC GCAAAAGAGA TCCCGGCAAC AAAGGATATC 
CTTGCACATG CCCCCGTGCA GCGCACCCCT GTGGAGTGGG GCCTGCGCTG GGTCTGGAAC 
CATCCTGAAG TCACTGTTGC GCTCTCGGGC ATGTCTGCGA TGGAGCAGGT GGTTGAAAAT 
ATTGCCTGCG CAGAACAGGG AAAGGCCGGC TCGCTCTCAA AAGACGATCT TGCCGTTATC 
GCTAATGTGA AAAAGGCGCT CGCAGAACGG GTGAAGATCC CCTGCACCGG CTGCCGGTAC 
TGCACCCCCT GCGAGAACGG GGTCGGGATT CCCGAGTGCT TTGAGTTCTA CAACCAGGCG 
CACATCTACG ACGCAAAGGA ACACGCCGGC GGGATCTACG GATGGGCCTT AAGCGGGATC 
TTCGGGGGCA TCCCGGCATA TGCCTCCTGC TGCACCGAAT GCGGGGCCTG CGAGGAAAAG 
TGCCCCCAGG GCCTCCCGAT CAGAAAGCAC CTCAAAGAGG TTGCAGAATT TTTCGGGAAA 
TAA

Protein sequence

MLYRRFPKVH QDISILGFGC MRLPVLENQQ INEPLATEMA RYAIDHGVNY VDTAYPYHNG 
ESEPFVGRAL ADGYREKVML ATKLPSWLIT KPGDMDKYLN EQLARLATDH IDFYLVHGLN 
AATWKATSEA GVLDFLDDAI DDGRIRYPCF SFHAALPLFK EIVDAYDWTF AQIQYNFMDE 
QYQAGTEGLQ YAAKKGIGIV VMEPLRGGLL AKEIPATKDI LAHAPVQRTP VEWGLRWVWN 
HPEVTVALSG MSAMEQVVEN IACAEQGKAG SLSKDDLAVI ANVKKALAER VKIPCTGCRY 
CTPCENGVGI PECFEFYNQA HIYDAKEHAG GIYGWALSGI FGGIPAYASC CTECGACEEK 
CPQGLPIRKH LKEVAEFFGK