Gene Mthe_0251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_0251
Symbol
ID	4462074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	247127
End bp	248245
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	54%
IMG OID	639699257
Product	radical SAM domain-containing protein
Protein accession	YP_842688
Protein GI	116753570
COG category	[R] General function prediction only
COG ID	[COG4277] Predicted DNA-binding protein with the Helix-hairpin-helix motif
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.996674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACGGT CGATCCTGGC ACGTGGTGCG AGCTTCGATC TCGAGGACGT TGATATTAAG 
GTTCAGGCGC TCAGCAGAAG CACCAGATAC GACAGGTGCT GCCACAGACG GAATGATGAC 
TCGCTGATCT ACAGTGCCTC AGGACGCAAT GGCTGCCATG TGCGCCTCTT CAAGACTCTC 
TTCACCAACG AGTGCTATCA TCAATGTGGC TACTGCCCCA ATGCAGGGAC ATCAAATGGA 
TGCTCCTACA CTCCAGAGGA GCTTTCCAAT ATAGTGAGCA GTCTGAGAAG AGAAGGGCTC 
ATTGACGGCC TCTTCCTGAG CTCCGGCGCG GGCAGGGATG AGGATTCCAC GATGGAGGAG 
ATGCTCGAGA CTGTGCGGAT TCTCAGGGAG AGGCACGGGT TCTCAGGATA CATCCACCTC 
AAGATTCTCC CTGGGACATC CAGGCACCTG ATAGAAGAGG CTGTGGAGCT CGCTGACAGG 
GTGAGCATCA ACATCGAGGC ACCATCGATG GATGTGATGC ATGAGCTCAG CCCGACGAAG 
GATTACGAAA GGGACATACT GGACAGGCAG ATGTACATAC GTGACATCCT GGCGAGACGC 
TCCAGAGGCT CCCAGACGAC ACAGCTTGTG GTCGGCGCAG CAGGTGAGAC AGACCTCGAA 
ATATTCCAGA GGGTTGTAAA GGAGTACAGG GAGATTGGGG TGAGCAGGGT CTATTACAGC 
GCATTTGTCC CTATCAAAGG GACGATCTTT GAAGGAAAAC AACCGCAGCT GAGATGGCGT 
GAGAGCAGGC TATACCAGCT CGACTGGCTT TATAGGGTCT ACAGACTCTC CCCCGAGCAG 
ATCAAAAATG TCTTCGACGA TTATGGATTT CTCATCAATC AGGATCCAAA GGTCATTCTG 
GCCGGAGAAT CGCTCGACCT GCCACTCGAT GTGAATGAGG CCGATTTTCA GAGCCTGATA 
CGAGTGCCTG GCATAGGGCC GGAGAGCGCA CGCAGGATCA TCTCATACAG GAGGAGGGAG 
AGGATAGAGA GTCCATCAGA TCTCATCAGG CTCGGCATCA AGAGGAAGGC GATACCGTAC 
CTGAAGATAA ACGGATGGGT GCAGAAGAGG CTCTTATGA

Protein sequence

MERSILARGA SFDLEDVDIK VQALSRSTRY DRCCHRRNDD SLIYSASGRN GCHVRLFKTL 
FTNECYHQCG YCPNAGTSNG CSYTPEELSN IVSSLRREGL IDGLFLSSGA GRDEDSTMEE 
MLETVRILRE RHGFSGYIHL KILPGTSRHL IEEAVELADR VSINIEAPSM DVMHELSPTK 
DYERDILDRQ MYIRDILARR SRGSQTTQLV VGAAGETDLE IFQRVVKEYR EIGVSRVYYS 
AFVPIKGTIF EGKQPQLRWR ESRLYQLDWL YRVYRLSPEQ IKNVFDDYGF LINQDPKVIL 
AGESLDLPLD VNEADFQSLI RVPGIGPESA RRIISYRRRE RIESPSDLIR LGIKRKAIPY 
LKINGWVQKR LL