Gene Mthe_1239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1239
Symbol
ID	4463170
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	+
Start bp	1334799
End bp	1335950
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	55%
IMG OID	639700256
Product	peptidase M24
Protein accession	YP_843658
Protein GI	116754540
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.862796
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTAGAG ATGCTGTTGT CGGCGCTGTC AGAGCGCTCG GAGTCGATGG ACTGCTTCTC 
GTGGGCGACA GCGTCTGCGA TGCTGATATC TACTATGCAT CGAGGTTTCT ATCCAGCGAT 
AGATTCGCTG TGCTGATCAC AGACAGGATC CATCTTCTGG TCTCCAGCAT GGAGAGAGCG 
AGGGCCTCGT CAGAATCAAA GGCTGATGTG GTGGAGACAA CGAGCGATTA CTCCATGAAA 
TCCAGGATCG AAGAGTTTGG GAGTGCTGAT AAGGCATACA TTAAGGTCCT CGAGGAGTTC 
GTCTCCAAAC ATGGAATCTC GCATCTCGGC ATACCCTCAA ATACCCCCGC GGGAATTTAC 
AGAAGCCTAA CTGAGCAGTT CGAGACCTCT CTCCTGGATA AACCATTTGA GCACATTCGC 
GCTGTTAAAA CGCCTGAGGA GATCTCAGCG ATTGCAGAAG TCCAGGAGGC ATGCGAGTCT 
GCAATGGAGG TTGCAGTAAG TCTCATAAAA AAATCAAAGC CCACTGGTGG CATCCTTGTT 
TTTGACGGCA AGCCGCTCAC CTCTGAAAGG GTGAGGAGCG CTGTTGAGCT CAGGCTTGCG 
GAGCTGGGAT GCGAGACTCT GGACACCATA GTCTGCGGTG GTCTCATGAG CTCCAGTCCA 
CATTCAAGAG GCAGCGGACT GCTTCCCGCG GACATGCCCA TCGTCATAGA CATATTCCCG 
CGATCGAAGA GCAGCAGGTA CTTTGCGGAC ATGACCCGAA CGGTCGTCCG CGGGGAGCCA 
TCGGTAGAGA TCGTGGAGAT GTATCAGGCT GTGAAGATAG CTCAGGAGGC GGGTCTGAAG 
TGCATAAAGG AGGGTGTGAG CGGAGCCGAT GTGCACGGGG CCGTATGCAG AACGTTCGAT 
GATTTTGGAT ACACAGAGCG GGAAGAGTGT GGTTTCATCC ACTCAACAGG CCACGGCGTC 
GGGCTGTCGA TACACGAGAG ACCCTCCCTG AGCGAGCACG GTGGGACGCT CAGATCAGGG 
AATGTGGTCA CGGTTGAGCC CGGGCTGTAC TATCCGGATA TCGGTGGAGT CAGGCTTGAG 
GATCTCGTGG TTGTCAGAGA GAACGGGTGC GAGAACCTGA CAGCATTCGA GAAGGAGCTT 
GTGATCCGGT AG

Protein sequence

MSRDAVVGAV RALGVDGLLL VGDSVCDADI YYASRFLSSD RFAVLITDRI HLLVSSMERA 
RASSESKADV VETTSDYSMK SRIEEFGSAD KAYIKVLEEF VSKHGISHLG IPSNTPAGIY 
RSLTEQFETS LLDKPFEHIR AVKTPEEISA IAEVQEACES AMEVAVSLIK KSKPTGGILV 
FDGKPLTSER VRSAVELRLA ELGCETLDTI VCGGLMSSSP HSRGSGLLPA DMPIVIDIFP 
RSKSSRYFAD MTRTVVRGEP SVEIVEMYQA VKIAQEAGLK CIKEGVSGAD VHGAVCRTFD 
DFGYTEREEC GFIHSTGHGV GLSIHERPSL SEHGGTLRSG NVVTVEPGLY YPDIGGVRLE 
DLVVVRENGC ENLTAFEKEL VIR