Gene Mthe_0940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_0940
Symbol
ID	4463333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	+
Start bp	1026993
End bp	1028246
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	57%
IMG OID	639699960
Product	UbiD family decarboxylase
Protein accession	YP_843368
Protein GI	116754250
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTTCA GATCTTTCCT AGAGGATCTC CGCGCGGATG GCGTTCTGGA GGAGACCCAT 
GAGCATGTAT CCACGGAGTA TGAGCTGGCC ATGCGCGCAA CCGGAAGGGG ACCGATGCTC 
TTCCACAATG CGGATGGCCA TGTCTGCTGC ATAAACATAC TCGGGAGCAG GGAGCTTCTC 
GCCAGGGCCC TGAGGATGGA TGCCAGGAAC CTCGCGCGCG ATCTCTCAGC TGTGGGCTTT 
GATGGCCATG TCAGAGAGGT CGACTCATCT CAGTTCCAGG AAAACATCCT GGAGCCGGAT 
CTGATGCGAC TTCCGGTGCT GAGGCATTTC AGAGGGGATG GCGGGCGGTA CATAACATCA 
GGCATTGTCG TCTCCAGGCT GGATGACAGG ATCAATGCAT GCGTTCACAG GCTCATGGTT 
CTCGACAGGA ATAGGCTGGC CGCCAGGCTC GTCCCGGGAA GGCACACGCA TCAGATGTAC 
TCCAGAGCCA TCGAAACCGG GAGGAGGTTG CCTGTTGCGA TCGCCATCGG CGTGGATCCG 
GTGGTTCTCA TAGCTGCTTC AACAAGAGTG CCTGAGAACA AGGAGTTTGA GTATGCATCC 
GCTCTCAGAG GGGATGTTGT TGAGGTTGTG ACCCTTGAGA ATGGCGTCCC GGTTCCGCAT 
GCTGAGATCG TTCTGGAGGG ATACCTGACG GAGAAGAGGG CTCCGGAGGG GCCGTTTGTG 
GACATCACCG GCACGATGGA TATCGTGAGG GAGGAGCCTG TCATAGAGAT CACCAGGATC 
ATGATGAGGG ATGACGCGAT CTATCATGCA CTTCTTCCCG CCGGAGGGGA GCACAGGATG 
CTGATGGGCG TGCCCTATGA GCCGCTGATA TACAGAGAGG CATCAAAGGT CGTGAGGGTC 
AGGAATGTGC TTCTGACGGA GGGTGGGTGC ACGTACTTCC ACGCGGTTGT TCAGATAGAA 
AAGCAGGAGG AGGAGGATGG TTTGAAGGCC ATACAGGCCG CGATGGCCGC ACACGGGAGC 
CTGAAACATG TGCTTGTTGT CGACACGGAC ATCGATATCC ACGATCCGAG AGAGCTGGAG 
TACGCGATCG CGACCAGGGT TCGCGGTGAT CAGGACATTT ACATGTATCC GAACGTGAGG 
GGGAGCACGC TGGATCCGAG ATCTGTGGAT GGGATGACAA CAAAAGTAGG GGTCGATGCG 
ACCGCAAAGC TCGACAGGCT CTGGAAGTTC AGGCGTGTTG TCAGACCGTG GTGA

Protein sequence

MSFRSFLEDL RADGVLEETH EHVSTEYELA MRATGRGPML FHNADGHVCC INILGSRELL 
ARALRMDARN LARDLSAVGF DGHVREVDSS QFQENILEPD LMRLPVLRHF RGDGGRYITS 
GIVVSRLDDR INACVHRLMV LDRNRLAARL VPGRHTHQMY SRAIETGRRL PVAIAIGVDP 
VVLIAASTRV PENKEFEYAS ALRGDVVEVV TLENGVPVPH AEIVLEGYLT EKRAPEGPFV 
DITGTMDIVR EEPVIEITRI MMRDDAIYHA LLPAGGEHRM LMGVPYEPLI YREASKVVRV 
RNVLLTEGGC TYFHAVVQIE KQEEEDGLKA IQAAMAAHGS LKHVLVVDTD IDIHDPRELE 
YAIATRVRGD QDIYMYPNVR GSTLDPRSVD GMTTKVGVDA TAKLDRLWKF RRVVRPW