Gene Mbur_1994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbur_1994
Symbol
ID	3996946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcoides burtonii DSM 6242
Kingdom	Archaea
Replicon accession	NC_007955
Strand	+
Start bp	2095822
End bp	2097012
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	49%
IMG OID	637959735
Product	bifunctional formaldehyde-activating enzyme/3-hexulose-6-phosphate synthase
Protein accession	YP_566623
Protein GI	91773931
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0269] 3-hexulose-6-phosphate synthase and related proteins [COG1795] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03126] formaldehyde-activating enzyme

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGTTGA TTGGAGAAGC ACTTATTGGC GAGGCACCAG AGCTCGCACA CGTTGATCTT 
ATGATCGGGG ACAAGGAGGG GCCGGTAGGG CAGGCATTCG CAACAGGAAT GACCCAGCTT 
TCAGCAGGCC ACACTCCCGT TCTTTCTGTC ATCCGCCCGA ACTTACCTAC AAAGCCATCC 
ACACTTATCG TTCCAAAAGT GACCGTTAAG GGAATGGATC AGGCTTCACA GATATTCGGT 
CCTGCACAGG CCGCTGTTTC AAAGGCAGTT GCTGATGCAG TGGAAGAAGG ACTGATCCCT 
AAGGAAAAAG CAGAAGACCT TGTCATCATT GCAAGCGTTT TCATTCACCC GCAGGCAGTG 
GACTATAACC GTATCTACAG GTACAATTAC GGAGCTACTA AATTGGCACT TAAACGCGCA 
CTTGATGGTT TCCCTGACAT TGATACAGTT CTTCATGAGA AGGACCGGGC TGCACACGCT 
GTCATGGGAT TCAAGATATC CAAACTTTGG GATGCTCCAT ACTTGCAGGT CGCACTTGAC 
AATCCAAACC TTCCTGTTAT CCTTAATATC ATCAAGCAGC TCCCTAAGAG CGACCACTTG 
ATACTGGAAG CAGGTACACC CCTTATCAAA CGCTATGGTG TGGATGTCAT TTCCAAAATA 
CGTGAGGTCA GACCGGACGC GTTCATCGTT GCAGATCTTA AGACCCTCGA CACAGGTAAC 
CTTGAGGCAC GTATGGTGGC GGATGCAACC GCTGATGCTA TTGTAGTATC CGCTCTTGCA 
CCTATCGCAA CACTCAACAA GGTAATTGAA GAGGCACACA AGACCGGTAT CTATGCTGTC 
ATGGATACAT TGAACACTCC TGATCCAGTA GCTGTCCTTG AACAATTGGA CGTACTTCCT 
GATGTAGTTG AACTACACCG TGCAATTGAC ATCGAGGGCA CTGCTCACGC ATGGGGCAGT 
ATCGAAGGTA TCAAGGCACT TGCAGTGAAG CGTTCTTCCA AGGTCCTTGT AGCAGTCGCT 
GGTGGTGTAC GTGTTGACAC TATCTCTGAT GCACTTGGAG CAGGTGCTGA TATCCTTGTC 
GTTGGCAGGG CTATCACCAA TTCAAAGGAT GTCAGGCAGG CAGCTGACCG GTTCATTGAA 
GGCTTGAACA AGCCTGAGAT CGACCAGTTC AGAATAATGA CCGATTTTTA A

Protein sequence

MMLIGEALIG EAPELAHVDL MIGDKEGPVG QAFATGMTQL SAGHTPVLSV IRPNLPTKPS 
TLIVPKVTVK GMDQASQIFG PAQAAVSKAV ADAVEEGLIP KEKAEDLVII ASVFIHPQAV 
DYNRIYRYNY GATKLALKRA LDGFPDIDTV LHEKDRAAHA VMGFKISKLW DAPYLQVALD 
NPNLPVILNI IKQLPKSDHL ILEAGTPLIK RYGVDVISKI REVRPDAFIV ADLKTLDTGN 
LEARMVADAT ADAIVVSALA PIATLNKVIE EAHKTGIYAV MDTLNTPDPV AVLEQLDVLP 
DVVELHRAID IEGTAHAWGS IEGIKALAVK RSSKVLVAVA GGVRVDTISD ALGAGADILV 
VGRAITNSKD VRQAADRFIE GLNKPEIDQF RIMTDF