Gene Mthe_1280 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1280
Symbol
ID	4461948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	+
Start bp	1388538
End bp	1390052
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	53%
IMG OID	639700297
Product	NHL repeat-containing protein
Protein accession	YP_843698
Protein GI	116754580
COG category	[C] Energy production and conversion [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0526] Thiol-disulfide isomerase and thioredoxins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.164299
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGCAGA TTTGTAAGAC TGCGATGAAT CCTCCTGCGA CCACAAGAGT GATCTGCACA 
CAATCCAGAG CAAACCCCAT GATAGCCCCT GAGTTCCCAG AGGATCTGGT ATGGCTCAAC 
ACCGACCGCA GGTACACACT GAGAGACCTC CGCGGCAGGT TTGTCCTCAT TGACTTCTGG 
ACATACTGCT GCATAAACTG CATGCATGTC GTTACCGACC TAAAAATGCT TGAGGAGAGA 
TATCCTGAGC TTGTGGTGAT AGGGGTTCAC ACCGCCAAGT TCGAGAACGA GATGAGAGTG 
GAGAACATCG AGAAGGCGAT AATGCGATAT GGAATCGAGC ATCCAGTCAT CGTGGATAGC 
GATCGAACCC TGTGGCGCGC ATACGGTATA AGGGCCTGGC CGTCTTTCGT CCTCATAGCG 
CCGGACGGGG AGATCCTCGG GAGGACCTCT GGAGAGGGGA TATTCTCGAT CCTTATGCCA 
ATAATGGAGC AGCTCATTCC GGAGTACGAG AAGCGCGGAA GCCTCCATCA TGGAAAGCCG 
GCGCCCAGAG CGACACATAA GGGCGTTTCC GGAGCACTCT CCTTCCCCGG AAAGGTGATC 
TCTGGTGGAG ACAATATCTT CATCGCGGAT TCGAACAATA ACAGAATACT GATCGTCTCT 
CCTGACGGTG ATCTGATGGA CGTTATCGGC TCCGGAGAGA GGGGATACAG TGATGGAGAT 
TTCAGCGAGG CACGGCTCTT CAGACCCCAG GGGATCGCTA TCGTCGGGGA TGTTGTTTAC 
ATCGCAGATA CAGGCAACCA CATGGTCAGG GCGGCGGATC TGAGAAGAAG AACTCTTGTG 
AGGATGGCAG GAACGGGAAA GTCACGGCAT CCTGGCCTTG GGGGCAGAGG CGCTGAAGTA 
TCACTGAGCT CCCCGTGGGA TCTCGTTTTC GTTCAAGATC ATCTCTACAT TGCGATGGCA 
GGATCACATC AGATATGGAG GATGGATCTT GAGGGGATGG TAGAGCCTTA TGCAGGATCA 
GGTATCGAGG GGCTCGCTGA TGGACCTCTG GAGCAGGCTC GCCTGGCCCA GCCGTCCGGG 
CTGACGACCG ATGGGAATAG GATATACTTC GTCGACAGCG AATCTTCATC ACTCAGGGTA 
ATAGATGGCG ATGTGAGAAC GCTCATCGGA AGGGATCTCT TTTACTTTGG GGACATCGAT 
GGTGATTTTG GGAGGGCCAG GCTTCAGCAT CCACTGGGGC TTTTTTACAA AGAGGGATCC 
ATTTATGTCG CGGATACCTA CAACCACAGG ATCAAGAAAG CTGACCTCTC GAGCGGATCC 
ATTCACACCA CCGCCGGAAC TGGGAGTCCC GGTTTCGCAG ATGGTCCTGG TGCTCAGGCT 
GCGTTTAATG AGCCCTCCGG CCTCACCTTT CTGGGGGATT CGTTATTCAT AGCGGATACC 
AACAATCACG CCGTTAGGAT ATACGATCAG AGATCAGGGG ATGTCTCCAC GATGAGAATC 
GATACGAAGA AATAA

Protein sequence

MMQICKTAMN PPATTRVICT QSRANPMIAP EFPEDLVWLN TDRRYTLRDL RGRFVLIDFW 
TYCCINCMHV VTDLKMLEER YPELVVIGVH TAKFENEMRV ENIEKAIMRY GIEHPVIVDS 
DRTLWRAYGI RAWPSFVLIA PDGEILGRTS GEGIFSILMP IMEQLIPEYE KRGSLHHGKP 
APRATHKGVS GALSFPGKVI SGGDNIFIAD SNNNRILIVS PDGDLMDVIG SGERGYSDGD 
FSEARLFRPQ GIAIVGDVVY IADTGNHMVR AADLRRRTLV RMAGTGKSRH PGLGGRGAEV 
SLSSPWDLVF VQDHLYIAMA GSHQIWRMDL EGMVEPYAGS GIEGLADGPL EQARLAQPSG 
LTTDGNRIYF VDSESSSLRV IDGDVRTLIG RDLFYFGDID GDFGRARLQH PLGLFYKEGS 
IYVADTYNHR IKKADLSSGS IHTTAGTGSP GFADGPGAQA AFNEPSGLTF LGDSLFIADT 
NNHAVRIYDQ RSGDVSTMRI DTKK