Gene Mthe_0101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_0101
Symbol
ID	4462493
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	94211
End bp	95236
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	56%
IMG OID	639699110
Product	glycerophosphoryl diester phosphodiesterase
Protein accession	YP_842543
Protein GI	116753425
COG category	[C] Energy production and conversion
COG ID	[COG0584] Glycerophosphoryl diester phosphodiesterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATATA CATGGCTCCA CCATACTCGA TCGATGGTCT CACTGATTGG ACATCGTGGT 
GCTCCAGCTC TGGCTCCCGA GAACACGCTG CAGGGAATAA GGAAGGCGCA TTCATGCGGA 
GCCGATATGG TCGAGATGGA CGTGCGTCTA TCCTCGGATG GCGTTCTGGT CCTAATGCAC 
GATGAGACTG TTGACAGGAC AACGAACGGC TCAGGCAGAG TGGAGGATCT GAGCATCGGG 
GAGCTCAGAG GTCTGGATGC GGGTGGAGAG CCAGTGCCGA CGCTGAAAGA GGCTCTTAGG 
CTCGCTGAGG TTCTCGGAAT CCAGCCGATC GTCGAGATGA AGGAGGAGGG CTTGGAGGAG 
CTTCTACTGG AAGAGCTTGT TGGGTTGAAC GCAGTTGTGA CATCATTTTA CCACAGAAGC 
GTGCTGGAAC TCAGTGAGCT TCTCAGAGAG AAAAAGGGCG CGGAGGGGAT AAAAACCGGC 
ATCATCATAT CATCCCTGCC CGTGAACCCT GTGGATCTGG CCCTGGATGC GCATGCGGAT 
GCGATATTTC CAAAGAGGGT GAGCCCGAAC ATCTTCAAGA TCGCACATAA AAGCGGTTTG 
AAGGTTTACC CCTGGACGGT CAACACCCCT GAGAGGGCGG CATGGCTCCT CAGGCTCGGG 
GCTGATGGCA TTGTCACCGA TGATCCATGC GCGATAAGGG ATGTGCTGAA AGCACCTCCA 
AGAAACACAG GGCAGGAGAA CTGCGAGTAT TACCCGTGTC ATCACTTCGA GGGGCAGGAC 
TGCACACACT GCTTCTGCCC GCTCTACCCA TGCAAGGACC CAGAGCTGGG CAGGTTTGTG 
AGAACGAAGA GGGGGAAGAG GTTCTGGTCA TGCATAGACT GCGTTCTGGT CCACATACCC 
GAGGTCGCCA GGTATCTCGA GGCGAACCCG GATGCTGGAA CAGAGGAGCT GAAGAACTTT 
CTCGGCACCA CTGGAAGGGG GTGCTTCCGC AGAGCAGACC GCGCTGGGAA GGGGACCGGC 
TCATGA

Protein sequence

MEYTWLHHTR SMVSLIGHRG APALAPENTL QGIRKAHSCG ADMVEMDVRL SSDGVLVLMH 
DETVDRTTNG SGRVEDLSIG ELRGLDAGGE PVPTLKEALR LAEVLGIQPI VEMKEEGLEE 
LLLEELVGLN AVVTSFYHRS VLELSELLRE KKGAEGIKTG IIISSLPVNP VDLALDAHAD 
AIFPKRVSPN IFKIAHKSGL KVYPWTVNTP ERAAWLLRLG ADGIVTDDPC AIRDVLKAPP 
RNTGQENCEY YPCHHFEGQD CTHCFCPLYP CKDPELGRFV RTKRGKRFWS CIDCVLVHIP 
EVARYLEANP DAGTEELKNF LGTTGRGCFR RADRAGKGTG S