Gene Mthe_0467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_0467
Symbol
ID	4462624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	483198
End bp	484349
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	54%
IMG OID	639699469
Product	radical SAM domain-containing protein
Protein accession	YP_842898
Protein GI	116753780
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.103489
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGAGGA AAAGGCCTTT TCACGTTATG ATCATTCCCA CTCTGGGATG TCCTTCCAAG 
TGCAGCTACT GCTGGAGCTC TGAGGAGGGC TCTCCGGTGA TGAGCATTGA TACTGTAAAG 
GAGATCGTCG AGTGGCTGAA GCTCTTTCGT GATGATCCCG TGACGTTCAC CTTCCACGGC 
GGTGAGCCGC TGCTGGCGGG TGTGGAGTTT TACAGGAAGG CACTGCCGTT GCTTGCAGAT 
GGCCTTTCAC ATCTCACTCC ATCATTTGCA CTGCAGACGA ACCTCTGGAG GCTAACGCCT 
GAGCTGGCTG AAGTCCTCAA GGAGTATGAT GTGCCGATCG GCTCAAGCCT GGACGGCCCG 
AAGGAGATAA ACGATCTTCA GAGGTCAGAG GGTTACTACG ATCGAACCAT GCGCGGCTAC 
GGCATTGCCC GCGATCACGG CCTGAGTGTG CAATTCATAT GCACATTCAC CTCGCACTCC 
ATAAAGTACA AACAGGAGAT CTTCGATTTC TTCATGAGCA ACGGATTGAC CCTGAAGCTC 
CATCCAGCGC TTCCATCGCT TCGCAGCGAC GAGCCGGAGC GGTGGGCCCT CGATCCATCT 
GAGTACGGGG AGCTTCTAGT TTATCTCCTC GACAGATACC TCGAGAACAT GGACAGGATC 
GAGGTGAGGA ACATCAACGA TCTCTGCAGA TGCGTCTTCA GCGGTCGGGG AACTGTGTGC 
ACATTCGTGG ACTGCATGGA TAACACGTTC GCTGTGGGCC CGGATGGGAG CATATATCCG 
TGCTACAGGT TTGTCGGGAT GCCCGATTAT GTCATGGGTG ATGTGAGAGA TCATCCATCA 
ATGGACGATC TGAAGCGATC TGAAGCATGG AGGCGGATGA ACCGCTTCAG GGAGTGCGTG 
GAGGTGCACT GCAGGAAATG CAGGCACCTC AGATACTGCA GGGGCGGGTG TCCTTACAAT 
GCGATATCCC ACACAGATGG GGAGATAAGA GGCGTGGATC CCTACTGCAT CGCTTACAAA 
AGAATCTTCG ACGAGATCAC AGAGAGGTTC AACAGAGAGA TGCTCAGCTC CTTCGGATTG 
CAGAGCAGCA AGCCTGGAAT AATCGCGCTC ATCCGCAAGA TCGCATCCAA GGAGGAGCCA 
AAAGGGCTGT GA

Protein sequence

MQRKRPFHVM IIPTLGCPSK CSYCWSSEEG SPVMSIDTVK EIVEWLKLFR DDPVTFTFHG 
GEPLLAGVEF YRKALPLLAD GLSHLTPSFA LQTNLWRLTP ELAEVLKEYD VPIGSSLDGP 
KEINDLQRSE GYYDRTMRGY GIARDHGLSV QFICTFTSHS IKYKQEIFDF FMSNGLTLKL 
HPALPSLRSD EPERWALDPS EYGELLVYLL DRYLENMDRI EVRNINDLCR CVFSGRGTVC 
TFVDCMDNTF AVGPDGSIYP CYRFVGMPDY VMGDVRDHPS MDDLKRSEAW RRMNRFRECV 
EVHCRKCRHL RYCRGGCPYN AISHTDGEIR GVDPYCIAYK RIFDEITERF NREMLSSFGL 
QSSKPGIIAL IRKIASKEEP KGL