Gene Mthe_0844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_0844
Symbol
ID	4463057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	910878
End bp	912536
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	57%
IMG OID	639699863
Product	DNA ligase I, ATP-dependent Dnl1
Protein accession	YP_843273
Protein GI	116754155
COG category	[L] Replication, recombination and repair
COG ID	[COG1793] ATP-dependent DNA ligase
TIGRFAM ID	[TIGR00574] DNA ligase I, ATP-dependent (dnl1)

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0357397
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGGCT TCGCGAGATT CGCAGAGCTC TGCGAGCGGA TATCACAAAC ATCAGGCTCT 
CTTGAGAAGA CAGACATACT GGCATCCTTC CTATCAGATC TGGAATCAGA TGATCTTAGA 
ATCGTTGCAG GCTTCGTCAT GGGTGTCGTC ATACCGGGAA CAGAGCTCGG TGTCGGCCCA 
AGCCTTCTCT ACGAGTCCAT ATCCAGGGCA ACAGGCCTGA GCAGCGATGC AGTAAATGAG 
CTCCTGCGTG CCACCGGAGA TCCCGGGCTT GTCGCGTACA GAGCGGTCGA GAGGAGAAAA 
CCGCTCACGC TTGCGGCATT CTCCGGAAGC GAGGGGCTCG AGGTACAGGA TGTCTATCAG 
AGGTTTCTCT CGATAGCAAA GGCCTCCGGC AGGGGCAGTC AGGAGATCAG GGTGAAGAAT 
CTTCAGTACA TGTTCAGTGA GGCCTCGCCG CTGGAGGCAA AGTACATCGC CAGGCTCGCG 
ATGGAGGACA TGAGGATAGG CGTCGGCGAG GGGCTCGTAA GGGATGCGAT TGCAAAGGCA 
TTTGGTGTGT CTAAAGAGGA TGTGGAGAGG GCGTACAACC TGACGAATGA TCTGGGGCTG 
GTCGCAGAGT ACGCGAAGCT CGGAAGGCTG AACGAGCTGG GGATAAGCAT AAACCGTCCG 
ATCAAGATGA TGCTGGCTCA GATCGGTGAG AGCATCGAGG CCTCTCTCGC AGAGGGCGCG 
ACAGCAGTGG AATGGAAGTT CGATGGCGCC AGGGTCCAGA TCCATAAGGA TAAGGGAAAT 
GTGAGAATAT TCTCCCGCAG ACTTGAGGAT GTCACATCGT CCCTGCCCGA GATAAGGGAG 
ATCGTGAGGG GGCATGTCAG GGCGAGGACA GCAATCCTCG ATGGGGAGGC TGTGGCAACA 
GGCGAGGACG GGCGGCCGCT CCCGTTCCAG GAGATACTAA GGAGGTTCCG CAGGAAGTAC 
GGAGTCGCGA GGACTGCGAA GACGATACCC CTGAAACTGC ACCTCTTCGA CATAATATAC 
ATGGACGGGG CGAGCCTTCT TGATGAACCT CTGGAGGAGA GGCGGAGGGT CCTCGTCAGC 
GTGGCGGATC CTGAGATCAT AGCTGAGCAG GTAGTGACGA GCGATGTCCA CAGGGTGGAG 
GAGATCTACA GAGAGGCGCT TGCAGCCGGG CACGAGGGCG TGATGCTCAA GAATCCCTCA 
TCGACGTACA CTCCGGGCAA GAGGGGCAAG AACTGGCTCA AGATCAAACC GCTCCTCGAA 
TCCCTGGATC TCGTTGTGAT CGGCGCACGG TGGGGGGAAG GGAAGAGAGC GAACCTTCTC 
GGCTCTTACA GGCTCGCCTG CATCGACACC GATACCGGGG AGCTGAAGGA TGTCGGCTGG 
GTCGCAACAG GGATCACGGA TGAGATGCTC GCGGAGCTCA CCGAGCTCTT CCGGGAGCTG 
ATAGTCAAGG AGAACGGGAT GGAGGTGGAG GTTCATCCGG AGATCGTCTT CGAGGTGGGC 
TATGAGGAGA TCCAGAGGAG CCCCAATTAC TCATCCGGCT ACGCCCTGCG TTTTCCAAGG 
CTGATCGCCG TCAGGGATGA TAAATCACCA TCTGAAGCTG ATACGCTTGA GAGGATTGGC 
GAGATATATC GGCTTCAGAG GGGCAGATCC AAAAAATGA

Protein sequence

MTGFARFAEL CERISQTSGS LEKTDILASF LSDLESDDLR IVAGFVMGVV IPGTELGVGP 
SLLYESISRA TGLSSDAVNE LLRATGDPGL VAYRAVERRK PLTLAAFSGS EGLEVQDVYQ 
RFLSIAKASG RGSQEIRVKN LQYMFSEASP LEAKYIARLA MEDMRIGVGE GLVRDAIAKA 
FGVSKEDVER AYNLTNDLGL VAEYAKLGRL NELGISINRP IKMMLAQIGE SIEASLAEGA 
TAVEWKFDGA RVQIHKDKGN VRIFSRRLED VTSSLPEIRE IVRGHVRART AILDGEAVAT 
GEDGRPLPFQ EILRRFRRKY GVARTAKTIP LKLHLFDIIY MDGASLLDEP LEERRRVLVS 
VADPEIIAEQ VVTSDVHRVE EIYREALAAG HEGVMLKNPS STYTPGKRGK NWLKIKPLLE 
SLDLVVIGAR WGEGKRANLL GSYRLACIDT DTGELKDVGW VATGITDEML AELTELFREL 
IVKENGMEVE VHPEIVFEVG YEEIQRSPNY SSGYALRFPR LIAVRDDKSP SEADTLERIG 
EIYRLQRGRS KK