Gene Mlab_0504 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_0504
Symbol
ID	4794511
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	+
Start bp	475700
End bp	476815
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	56%
IMG OID	640099162
Product	sulfopyruvate decarboxylase subunit beta / sulfopyruvate decarboxylase subunit alpha
Protein accession	YP_001029945
Protein GI	124485329
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase] [COG4032] Predicted thiamine-pyrophosphate-binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGAAG AAACGGTTCT TCGGATCATG CATGAAGAGG GGATCGACAT GGTCGCTTCC 
CTGCCGTGCG ATAAAAACAA GCGGTTTACT GCGCTTTTAG AGACGGAGTT TTCGGTCATC 
GACCTTGCCC GCGAAGAGGA TGGGGTCGGG ATCGGGGCTG GAGTGGTTCT CGCCGGAAAA 
CGTCCGCTCG TCTCGATCCA GAGCTCGGGC CTTGGGAATA TGCTCAACGC TCTTCTGTCG 
CTTTCCTGCG TGTATCACTT CCCTCTGCCG ATCCTGGCAA GCTGGCGAGG CGTCTGCGAT 
GAGAAGATCT GTGCCCAGAT CCCGTTCAAT GCCCCGCTGC CGAAACTTCT GGATGTGTAC 
AACATCCCTT ACCGGATCTG CAGATCCGCG GAGGATCTGG AAGGGATCCG AGAGGTCATA 
AAGGGGGCGT TTACACAGCA GACGCCCTAT GTCGCTCTGA TCCTTCCCTC CTGCTGGGAC 
CCGCAGCAGG AATCGCCCAT TACGTATCCG AAACGTTCGC TTCCGGACCG GACGTTTTTC 
CTTCCCGGAT ACTCTGAGCC AAAACTCACA AGACTCAAGG CGATCGAAAA AATCGTTTCA 
GCGGTTCCAG AAAACGCGGT CATCATCTCC AACATCGGGG TCCCGTCCAA GGAACTGTAT 
GCCTCAGGAG ACCGGCCAGG AAACTTCTAC ATGCTCGGCA GCTACATGCA GGCGTCCGCG 
ATCGGGCTCG GTTGTGCGTT TTCTTCACCG AAAACGCCCG TCTATGTGAT AGATGGGGAC 
GGAAGTCTGC TTGGATCCGC AGTTCTTCCG GTGATCGCGG CACAGAAATG CGAAAATCTG 
CATATTATGG CGCTGGACAA CGGCACATTC GGCAGCACAG GAAACCAGAT CAGTCCGGCG 
TATGAAACCG CCGATATCGG CATGCTCGCA CGTGCAGCCG GAATCGGCTC GGTCGAACGC 
GCCGTATCTC CGGAAGATAT CTCACGTGCC GTGGCCAAAG GAACTTCATT CGTTCATCTG 
CTGATACGCC CGGAAAACTC GGCGTCCCCC AATATCCCTC TCTCCCCCGA AGAGATCCGC 
AGTAGAACGG AACTGTTCAT CCGGAAAAAC GGATAA

Protein sequence

MNEETVLRIM HEEGIDMVAS LPCDKNKRFT ALLETEFSVI DLAREEDGVG IGAGVVLAGK 
RPLVSIQSSG LGNMLNALLS LSCVYHFPLP ILASWRGVCD EKICAQIPFN APLPKLLDVY 
NIPYRICRSA EDLEGIREVI KGAFTQQTPY VALILPSCWD PQQESPITYP KRSLPDRTFF 
LPGYSEPKLT RLKAIEKIVS AVPENAVIIS NIGVPSKELY ASGDRPGNFY MLGSYMQASA 
IGLGCAFSSP KTPVYVIDGD GSLLGSAVLP VIAAQKCENL HIMALDNGTF GSTGNQISPA 
YETADIGMLA RAAGIGSVER AVSPEDISRA VAKGTSFVHL LIRPENSASP NIPLSPEEIR 
SRTELFIRKN G