Gene Mthe_1634 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1634
Symbol
ID	4462506
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	+
Start bp	1778221
End bp	1779231
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	55%
IMG OID	639700653
Product	flap endonuclease-1
Protein accession	YP_844041
Protein GI	116754923
COG category	[L] Replication, recombination and repair
COG ID	[COG0258] 5'-3' exonuclease (including N-terminal domain of PolI)
TIGRFAM ID	[TIGR03674] flap structure-specific endonuclease

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGTCG ATCTCGGAGA TATTCTCAGC AAAAAGAAGA TCTCCCTTGA GAATCTGTCT 
GGATGCTGGA TAGCAGTCGA TGGATTCAAC ACGCTGTACC AGTTCCTGTC GATCATAAGA 
CAGCCTGACG GCACACCTCT CATGGACGCC TCCGGAAGGG TCACATCGCA CCTCTCGGGA 
TTGCTCTACC GCATGACGAA CCTCATAGAG GTCGGGATCA GGGTTGCGTT TGTCTTCGAT 
GGCACGCCTC CTGAGCTCAA GGCCGGGACG CTCGCTGCCA GGGCTCAGAT GAAGGAGGCA 
GCGGAGATCC AGCTGCAGGA GGCGATAGCC ACAGGCGTCG ATAGCTTCAG GTATGCACAG 
GCCACCGCCA GGATAAACAG CGAGATACTT CATGACTCCA TAAGGCTCCT GGATGCCATG 
GGCATCCCAT ATGTGCAGGC GCCCTCAGAG GGCGAGGCGC AGGCAGCATT CATGGCGATT 
CGGGGGGATG TTGATTATGT AGCATCTCAG GACTACGACT CCCTGCTCTT CGGCGCGCCG 
AGGGTTGTGA GGAATCTTGC AATCACAGGC AGGAGGAAGA TGCCCAGGAA GAACATTTAC 
ATCGATGTTC CTCCTGAGGT CATCATCCTG GAGGAGGAGC TCACGAGGCT CGGGATAAGC 
AGGGAGCAGC TCATAGATAT CGGAATAATG TGCGGTACCG ATTACAACAG AGGACTTCCA 
AAGGTGGGTC CTAAGAGGGC GCTCAAGCTG ATACGAGAGC ACGGATGCCT GGAGGCTGTG 
CTCGATGCGC TTGGAGAGAG CATTGAAAAT TTTCGGGAAA TAAGAGAACT ATTCCTGCAT 
CCTGCGGTCA CGGAGAGCTA CGAGCTGAGG ATGAGAAAGC CCATGGTCGA TGAGATCGTC 
GGGTTTTTGT GCAACGAGCG CAACTTCTCA GAGGATAGGG TCAGAAAGGC CGCTGAGAGG 
TTGAATGCGT CGTACCGTTC CGGCCAGAGC ACACTGGAGA GGTGGCTCTG A

Protein sequence

MGVDLGDILS KKKISLENLS GCWIAVDGFN TLYQFLSIIR QPDGTPLMDA SGRVTSHLSG 
LLYRMTNLIE VGIRVAFVFD GTPPELKAGT LAARAQMKEA AEIQLQEAIA TGVDSFRYAQ 
ATARINSEIL HDSIRLLDAM GIPYVQAPSE GEAQAAFMAI RGDVDYVASQ DYDSLLFGAP 
RVVRNLAITG RRKMPRKNIY IDVPPEVIIL EEELTRLGIS REQLIDIGIM CGTDYNRGLP 
KVGPKRALKL IREHGCLEAV LDALGESIEN FREIRELFLH PAVTESYELR MRKPMVDEIV 
GFLCNERNFS EDRVRKAAER LNASYRSGQS TLERWL