Gene Mthe_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1040
Symbol
ID	4463108
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	1124812
End bp	1125813
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	50%
IMG OID	639700058
Product	dienelactone hydrolase
Protein accession	YP_843464
Protein GI	116754346
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGAAG AAAAAGTTAT GGTTGAAAAG CCTGTAACCT TTTACAGCGG ATCCTCTCGG 
CTTGCTGGGG TCCTCAGATA CCCATCTGTG ATTAAAGACC CTGCACCTGC GGTCCTTCTG 
ATCCACGGAT CACTTGAGCA GGACAGGGAC GGAAATCTAT TAAACAGACC GGATGGAAGA 
CCAATATTCA AAAAGAACTT CTTCCTGGAG ATATCGAAGA GGTTATCAGC GGAGGGATTC 
GCAACATTCT CATGGGACAG AAGAGGCTTT GGAGAGAGCG AGTCTTCTAT CCGTGATGGC 
GGGTACCTTC AGGATGGAAT AGATGCGATG GCCGCCTATC AGGCTCTCTC CTCCCTCGAT 
CTCGTAGATC CTGAAAGAGT CGCGGTCCTG GGTCAGAGCG CTGGAGTTTA TACAGCATGT 
CTCCTGGCTG AAAAGGAGAG TAGACCGAAA GCGTACATTC TCCAAGGTGG TCTTTACAGG 
GATTATGAGG AGATGATGAT CTTCAACTAC CTAAGGGTAG TGGATTACGC CTCAAAGAGC 
CCTGAGAACC TCAGATGGGT GGAAGAGAAC GACCCACTTG GCCTGGTAAT TGGACTGAAC 
CTCTACACGC TGATGGAGAG GGCGAGGATG GGCGAGGTCG AACACCAGTT CAGCTATAAG 
GGAAGAACGT GGAGGATTTG GCACGACCCG ATCTGCTATT TACCGGAACA CGCTCCGAGG 
AACCTGTTCA AGTACATACA AAAGCCCACT CTTGTAATCC ATGGGGCCTG CGATCTGAAT 
GTTCCTGTTG AGGATGCCTT CATGATCGAG CGGGATTTGA AAAAGCACGG CAACGAGAAT 
GTGGAGCTGG CCATTATCCC AGATGCGGAC CACAGCTTCC AGCAGATCGC AGAGTCATAC 
GATCTCACAC TCAGAGAGAG AATGAGTCTT GAGAGCTTTC GACGTCCATA TCGAGAGGAT 
TACTTTATGG CAGTAATCTC TTTTCTCAAG AGGTGGCTTT GA

Protein sequence

MSEEKVMVEK PVTFYSGSSR LAGVLRYPSV IKDPAPAVLL IHGSLEQDRD GNLLNRPDGR 
PIFKKNFFLE ISKRLSAEGF ATFSWDRRGF GESESSIRDG GYLQDGIDAM AAYQALSSLD 
LVDPERVAVL GQSAGVYTAC LLAEKESRPK AYILQGGLYR DYEEMMIFNY LRVVDYASKS 
PENLRWVEEN DPLGLVIGLN LYTLMERARM GEVEHQFSYK GRTWRIWHDP ICYLPEHAPR 
NLFKYIQKPT LVIHGACDLN VPVEDAFMIE RDLKKHGNEN VELAIIPDAD HSFQQIAESY 
DLTLRERMSL ESFRRPYRED YFMAVISFLK RWL