Gene Mthe_0046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_0046
Symbol
ID	4462738
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	+
Start bp	41252
End bp	43309
Gene Length	2058 bp
Protein Length	685 aa
Translation table	11
GC content	53%
IMG OID	639699055
Product	carbohydrate-binding and sugar hydrolysis
Protein accession	YP_842489
Protein GI	116753371
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3420] Nitrous oxidase accessory protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0357051
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGCCTGT GGCGGGCTGT GCTGATAATG TCTCTGGTGG TCATGATAGT ATCCGCATCC 
AGCGCGAGGA TTCTGGTTGT GGATCAGGAG GCGACGGGCG CGATCAGAAG CGTGAATGCA 
GCGCTCGCAA ACGCGCAGAA CGGTGACGAG ATACTTGTAA TGGCGGGGTA TTATAGGGAG 
AGCGTGGATG TCAATAAGTT GGTCTCCATA AAAGGATATG GTGCGATCAT CGACGGCATG 
GGCCGTACGA CCTTCCAGAT GAGATCATAC GGGAGCAGCA TATCCAACCT CACGATCCTC 
GGGAGCGGCA GGGATCCGGC AGTCGTGGTA GAGGGATATG CATCTGTGAC CGGCTGCAAC 
ATCAAAAACT CCTCCATTGG AATCGCGGCA TACAAGGGAG TGGTATCGAA CAACACTATT 
TCAGCTACCG CATATGGGAT CAGGCTGAAC GGCTCCGCGA TTGTAGAGAA CAACACGATA 
TCAGGACCGC TGGGGGCCGG CATAGAGGTG AGGTGCAACA GCTCCAGGAT CCTCAGTAAC 
ATTGTGACCT CTGCAGGAAA TGCGATAGAT GTGGTCGGAA ACAACAACAC CGTTCTTTTC 
AACCACCTCT CCTCATCGAA CATAGGCATA CGGCTGAAGT CATCTTCTGA TAACATAATG 
ATGAATAACA CCTGCGAGAA GAACAGGATC GCTGGAGTTT ATCTGGAGGA TTCCAGGAAC 
AACAGCGTAT CCTCGAACAG GTTTCTCCGC AACGGCAACG GTATCCTCCT GAAATCCTCT 
TCGGGTAATA AGATAATCGG AAATATCGTA GAGCTGAACG AGTACGGGAT ATCGATGAAG 
GGCTCTGGTG GTAACCTGCT CAGAGAGAAC GTGCTGATAT CAAATATATA CAGCTTGAGG 
ATAGAGGCAG GCAACCTAGG AGATCTCAGG CTCATATCAG ATCCCAGGGC CAGGATGGAC 
GACAACTCAT TCAACCAGAG CATCGATGAG TCGAACACGA TAGATGGCAG GCCGGTTCTG 
TATCTGGTAG GTGCTCGCAA CGTTTCGATA GATAAGAGCT ACGGATTTGT GGGGCTCATA 
GACTGCGAGA ACATCACGAT GAGAAACCAG AGCATATCGA ACAGCAGCGC GGCCATCATG 
CTTGTGGGAG CAATCGACTC CAGGATCTCG GACTGCAGGC TCTCCAGAAG CGAGATAGGG 
TTATCGATCC TCGACTCGAA AGGCTGTGTG GTGGAGAACA CAACCGCAGA GTCCTGCGGG 
ATCGGCTTCT GGTTCGGTCG GTCGCAGGAT ATCTTCGTGA GAAAGAGCGC GGCGCTGAAC 
TGCACAGAGA GCGGATTCAG GCTCGAGGGT GACAGGAGAT CGAGGATAAC GGACTCCCGG 
GCAGAGAACT GCACTGCCGG GATGCACCTC CTTGACGCCC TCTCCTCAGA GATCGTGCGT 
TCCAGGATAT CCTCAAGCAG TGAGGATGGC ATACGGCTGG TCAGGTCGCA CAGATCAACG 
GTGAAGGAGA ATGAAGTGAC AGGAAACGAC AACGGCATAG CGATCTCCGG CTCAAATCAG 
TGCGTTCTTG CGATGAACAA CGCGAGCGCC AATGGGATAG GGATAAGGAT CGAGCAGCTC 
TCCGGAGGAT CTGCTGCTGA TAACATCGCT TTCCGGAACA GGGAGGGGAT CTTCGTGAAC 
GGGGTGAAGG AATTCCAGTT CATCGGCAAC AACATCAGCA TGAACGAAAG ATTCGGAATG 
CGAATGGGAA GCAGCTCAGG CTGCAATATA AGCGATAATA GATTCGTAGG CAACGGCATG 
CTCGGCCTGA GCCTGACAGA CTGCAGCGAC AACAGAATCT ACCACAACAG TTTCATCGAG 
AATGGTTCAA TGTTTGGACA GAACGCCGTG GATAACGGAA GCAACCTCTG GGATATGGGG 
CCGGTGATCG GAGGAAACTA CTGGTCGGAT CATCAGGTTA GTGGAAATCC CGGAGATACT 
CCAAAGAATG TGCCATCAAA GGGCGTGGAC AGATATCCAT TCGAGAGGGA TAATGGATGG 
AGGTCACCCG CTCTGTGA

Protein sequence

MGLWRAVLIM SLVVMIVSAS SARILVVDQE ATGAIRSVNA ALANAQNGDE ILVMAGYYRE 
SVDVNKLVSI KGYGAIIDGM GRTTFQMRSY GSSISNLTIL GSGRDPAVVV EGYASVTGCN 
IKNSSIGIAA YKGVVSNNTI SATAYGIRLN GSAIVENNTI SGPLGAGIEV RCNSSRILSN 
IVTSAGNAID VVGNNNTVLF NHLSSSNIGI RLKSSSDNIM MNNTCEKNRI AGVYLEDSRN 
NSVSSNRFLR NGNGILLKSS SGNKIIGNIV ELNEYGISMK GSGGNLLREN VLISNIYSLR 
IEAGNLGDLR LISDPRARMD DNSFNQSIDE SNTIDGRPVL YLVGARNVSI DKSYGFVGLI 
DCENITMRNQ SISNSSAAIM LVGAIDSRIS DCRLSRSEIG LSILDSKGCV VENTTAESCG 
IGFWFGRSQD IFVRKSAALN CTESGFRLEG DRRSRITDSR AENCTAGMHL LDALSSEIVR 
SRISSSSEDG IRLVRSHRST VKENEVTGND NGIAISGSNQ CVLAMNNASA NGIGIRIEQL 
SGGSAADNIA FRNREGIFVN GVKEFQFIGN NISMNERFGM RMGSSSGCNI SDNRFVGNGM 
LGLSLTDCSD NRIYHNSFIE NGSMFGQNAV DNGSNLWDMG PVIGGNYWSD HQVSGNPGDT 
PKNVPSKGVD RYPFERDNGW RSPAL