Gene Mthe_1086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1086
Symbol
ID	4461810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	1176255
End bp	1177355
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	56%
IMG OID	639700103
Product	hypothetical protein
Protein accession	YP_843509
Protein GI	116754391
COG category	[S] Function unknown
COG ID	[COG4069] Uncharacterized protein conserved in archaea
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGATGAGC GCAGGCTCTT GATAGGCGTT GTAATTCATG GCCCTGAGGT AGTGGATACT 
GGGTTTGCTC TTCAGGCCCT GGAGTGGCTT GAGGAGCGTG GTGATGTGGT GGCAGTCCTC 
GGCGGTACCA TGGGCAGGGT TGCGGTCATC GACGCCGGGC TTGAGAGAAG GATAGATATC 
AGCAGGCGCA GGTCCCCCAG CCAGTCTGTG CACGACCTCC AGCACTCGGA TCTCACAGTT 
CTCCTGAACC ATGCGAAGAG CAGGGAGACG GGGCTTGTTT TTGGAGCGAT CGTGGCTGCA 
AGGGCAAGGC CCGCGAATCC CCTAGTTCAG GTGGACTCCG GCGGTCGCTT CGTCGCAGCC 
CTTGCGAATC TCTCTGAGAA AAGCGATGCC ATCGCAAAAG GCCTTGCATC ACATTTCGGT 
TTTGATATTC TGGACGCCTG CATGCCTTAT GACAATCTGC GCCAGGAAGG CGATGTTATC 
GTGAGAAGGA TGAGCGGGGT CCTGCCGGGA GAGAGGATCT CCGTCAACGG CACGGTTATC 
GGCACTGCCA CGGATGCACA TGTCGAGATC ATGGCCCGTG ACGGAAGGAT TGTCGGCGGG 
AGAGGGATCA ATCTCAAGAG GCACGGTCTG GAGAAGCTCC CCTATGTCGA TCTGAGATCC 
GCGATACTTA GAAGTGGGTC TGTGCGGAGA ACCGCAGGGA TGCTGAAACC AAGGATTTCC 
TCTGTCAAAA CGAGCAGGAA CGGCAGGTTC GCGATCATAG ATCATGCTGC AGAGGAATCA 
TTCGAGCATG CATCAGATGC ATCATTTGTA ATAACTATAG GAGACGATAC AACTGCCATC 
GCCGGAGATG TTCTCTCCAG GCTTGGGATA CCGGTGCTGG GGATAGTCGA TGGCGATCTC 
GACTGCATCT GCAACGGGCT TGTCATGCCG GAGGGGAGCG TGGTCGTCAG GGTTAGAGAG 
GGGAACGATG ACATAATCGG AAGGGCCATA AAAGCGATAT CGGAAAAGCA CAGACCGTCA 
AGCCTGAATG AGGCGCTGGA TATGGTGAGA GAGGTGGCTG GAGAGCGCAT CGTCTCCGTC 
ATCCGATGCA ACGGCAGATG A

Protein sequence

MDERRLLIGV VIHGPEVVDT GFALQALEWL EERGDVVAVL GGTMGRVAVI DAGLERRIDI 
SRRRSPSQSV HDLQHSDLTV LLNHAKSRET GLVFGAIVAA RARPANPLVQ VDSGGRFVAA 
LANLSEKSDA IAKGLASHFG FDILDACMPY DNLRQEGDVI VRRMSGVLPG ERISVNGTVI 
GTATDAHVEI MARDGRIVGG RGINLKRHGL EKLPYVDLRS AILRSGSVRR TAGMLKPRIS 
SVKTSRNGRF AIIDHAAEES FEHASDASFV ITIGDDTTAI AGDVLSRLGI PVLGIVDGDL 
DCICNGLVMP EGSVVVRVRE GNDDIIGRAI KAISEKHRPS SLNEALDMVR EVAGERIVSV 
IRCNGR