Gene Mthe_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1039
Symbol
ID	4463107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	1123043
End bp	1124647
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	48%
IMG OID	639700057
Product	transposase
Protein accession	YP_843463
Protein GI	116754345
COG category	[L] Replication, recombination and repair
COG ID	[COG5421] Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.301792
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGACAG ACACGCGATC GCTGGATCAT TTGGGGATAG TTGCGGCGGT TTTCGACCGG 
CTTGGCATAG CGGATGTTAT AGATTCGCGT ATGCCGAAGT TGAGGCAGCA CAAGCTGGAA 
CATTCGGTGA TTGTTAAGGC GATGGTTCTG AACGGTCTTG GTTTTGTGGG TCAGAGGTTG 
TACCTGTTTC CGGAGTTCTA CGAGAGGCTG CCTGTTGAGA GGCTTCTTGG GGATGGAGTT 
AACGCATCTG ATTTGAACGA TGATGCGATA GGCAGGACGC TGGATGCGAT TTATGAGCAA 
GGTGCTACGG ATCTTTTCAA CGAGATAGCG TTGAAGGTGA TGGGAGAGCT CGAGCTTGGA 
GTCCAGAGGT TGCACGCAGA CACCACAAGC TTCAGCGTTC ATGGCAGCTA TGAGGGTTTC 
AATGGCGGTA GATCGATTGA GATAACGTTG GGCCATTCGA AGGACAGCCG GATGGATCTG 
AAACAGTTTG TTCTCAGTCT TGTGACGAAC CAGGACGGTA TACCGCTTTT TGCAAAAGCG 
CATTCAGGTA ACGCATCCGA CAGGAACACG ATCATAGAGT CGTTTTTAAA GATCAAATCC 
GGACTCAACC TTGAAGACTG CGCGTATTAC ATAGCAGACA GTGCAGTCTA CACCGAGCCC 
AACATCAGGA TGCTCGGCAG GGAGATGAAA TGGATAACAC GTGTCCCGGC CACGATAAAG 
GAGTGTGAGA TGCTTCTTGA CAGCGATGTT GAGATGGTTG AGTGTCGCGA CGCCAGGTAC 
AGATGCTTCT CGACGACCTC TGATTACGGC GGAGTACAGC AGAAGTGGGT CCTTTACCAG 
TCAGAACCGA TGCGAGATCT CAAGGCAGAG AGGTTCGAGA ATCATCTTGA AAAGGACGGG 
ACAAAAGCAA GACGGTCTCT GGCAAAACTG AAACGGCGTG AGTTCGCATG CGAAGCAGAC 
GCACTGAAAG AAACTGAACT GTGGGCCAGA GACCATCCGC TCTACAGGTT CAGCCATATC 
TCTCTCAAAA AGGTCTGCAA ACGAGCAGAT AAAAAACGAG GACGACCTAA AAACGGCGAA 
AAACTCATCG AAATATATTT TATAGACGCG GATATCGAAC TCGACCAGGA AAAAGTCGAA 
AAAACGAAAT CCAGGCTCGG AAGGTTTATA ATCGCAACTA ACGACCTCAA TATCGACCCT 
GATACACTAC TCAGCTACTA TAAAGGACAG CAAGAGGTAG AACGCGGATT CAGGTTCCTC 
AAAGACAAAA GCTTCCGAGT CGCAGAGGTC TACCTCAAAA AAGAAGAACG CATCGAAGCT 
CTCGCCATGA TCATGGTCCT CTCACTCATG ATCTATTCCG TGGCAGAGTG GCTGATCAGA 
AAAAGGTTGC AAGAATCAAA TCAATCCATA CCAAATCAGC TGAAGAAACC CACACAAAAA 
CCAACTCTCA AGTGGATCGC GTTCATGTTC CTCGGTGTCA CCGAAGTCAA CATATGGCTG 
CGCGGCGAGA AACACCAGGA AATCGCTAAC CTCAACGAGA ATACTTTGAA AATAATAAAA 
CTGTTTGGAC CAGAATGCGA AAAATACTAC GGAATGGAGC GTTAA

Protein sequence

METDTRSLDH LGIVAAVFDR LGIADVIDSR MPKLRQHKLE HSVIVKAMVL NGLGFVGQRL 
YLFPEFYERL PVERLLGDGV NASDLNDDAI GRTLDAIYEQ GATDLFNEIA LKVMGELELG 
VQRLHADTTS FSVHGSYEGF NGGRSIEITL GHSKDSRMDL KQFVLSLVTN QDGIPLFAKA 
HSGNASDRNT IIESFLKIKS GLNLEDCAYY IADSAVYTEP NIRMLGREMK WITRVPATIK 
ECEMLLDSDV EMVECRDARY RCFSTTSDYG GVQQKWVLYQ SEPMRDLKAE RFENHLEKDG 
TKARRSLAKL KRREFACEAD ALKETELWAR DHPLYRFSHI SLKKVCKRAD KKRGRPKNGE 
KLIEIYFIDA DIELDQEKVE KTKSRLGRFI IATNDLNIDP DTLLSYYKGQ QEVERGFRFL 
KDKSFRVAEV YLKKEERIEA LAMIMVLSLM IYSVAEWLIR KRLQESNQSI PNQLKKPTQK 
PTLKWIAFMF LGVTEVNIWL RGEKHQEIAN LNENTLKIIK LFGPECEKYY GMER