Gene Mthe_0201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_0201
Symbol
ID	4462767
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	198736
End bp	200190
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	55%
IMG OID	639699208
Product	radical SAM domain-containing protein
Protein accession	YP_842639
Protein GI	116753521
COG category	[C] Energy production and conversion
COG ID	[COG1032] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGTTC TGCTTCTTGC CTCGCCGGTG GTGCAGCCGG ACTTCGACAG GATCGCGAGG 
ATACCCGACC TCGGCCTGGT CTCGCTTGCA GCCGCAATCG ATGATCTGTG TGATGTGCAT 
GTCGCAGATC TCCACGGCAT AAAAGACCCG GATGAATTTG TGAGAAGGCA TGCGAACCGC 
TACGATCTGA TAGGGCTCAC AGCGATGAGC TTTCAGTATG CAAGGGCCCT CGAGCTCGCC 
AGGATAGCCA AGGATGCGGG GGCGGAGGTC GTGATCGGCG GATACCACCC CACGCTCTTC 
TACAGGGAGA TAGGATCGAG CAGCGATTTG ATGCTCATAG ACTACATAGT CCGCGGTGAG 
GGTGAGAGGA CCTTCAGGGA GCTGGTGCAG GCTCTGATCA GGGGCAGCCA GCTCGATGAT 
GTTCCTGGTC TCTCCTACAG ATTTGGCTCG GAGATGAAGC ACAACCCTCC GAGAGCTCTG 
CTCAATCCTG AGGAGATCGA GATGCCAAAC AGGGATGCTC GCCTGATCAG AGATGGTTTC 
TATGCGTTTG ATGTCCCTGT TGACTCCGTG GAGACGAGCA GGGGGTGCAC ACAGGGATGC 
AAGTTCTGCT CGATAAACAG CATGTACGGC AGGAGCTTCC GCAAGTTTGA GATCAAGAGG 
GTCATTGAGG ACATACAGGA TGCGGAGGAG CACGGCGCAG GCTCGATATT CTTCCCCGAT 
GACAACATCA CTCTTGATGT GAAAAGATTG GAGGCGATAT GCGATGCCAT CATAGACGCA 
GGTCTAACGC ATCTCAGGTA CAAGACGCAG GCATCTGCAT CAGGCATCGC CTCCAGTGAG 
AGGCTCGTTA AAAAGATGGG CGAGGCAGGT TTCGATGGTG TATTCCTTGG CGTTGAGAGC 
GCCAGCAAGA GGAACCTCCA GTTTTTCGGA AAGGGCAGGA TGTCGGATCA TGCAGAGCGT 
GCTGTGAGAT ACCTCCACGA TAACGACATC ATCGTATCCA CAGGGCTCAT CGGCGGAAAT 
CCAGATGACA CTGCAGAGGA CATGTGGGCG AACTTCCACC TCGCAAGACA GCTAAAAGTC 
GATTTTCCCA TATTTTATAT CAACACACCT TACCCCAAGA CCCCGATGCG CGAGGAACTG 
GAGCGGATGG GGCTGATAAC GAACAACGAC TTCAGGTTCT ACGATGGTCT TCACGCCAAT 
GTACGCACAA AGCACTTGAG CGCTGAGGAG GTGCAGTATA TCACGTGGGA GATGAACGCC 
AGGTACTACA ACTGGGAGTG GTTCAAGTAC AACAAGGTCA AGAGGCTTTA TCCGAGGTGG 
TTCGCGAGGG AGGCCCTGCG GCTCGCCCCG ATCTACGCGA AAAGAAAGCT CGAGCTCCTC 
CTGAGGATAA AGAGCAGAAG AGATATGTTT CGGGAGGACC TGGCGCGGGG GGAGCTGTGC 
AAGGGTGTGG CGTGA

Protein sequence

MRVLLLASPV VQPDFDRIAR IPDLGLVSLA AAIDDLCDVH VADLHGIKDP DEFVRRHANR 
YDLIGLTAMS FQYARALELA RIAKDAGAEV VIGGYHPTLF YREIGSSSDL MLIDYIVRGE 
GERTFRELVQ ALIRGSQLDD VPGLSYRFGS EMKHNPPRAL LNPEEIEMPN RDARLIRDGF 
YAFDVPVDSV ETSRGCTQGC KFCSINSMYG RSFRKFEIKR VIEDIQDAEE HGAGSIFFPD 
DNITLDVKRL EAICDAIIDA GLTHLRYKTQ ASASGIASSE RLVKKMGEAG FDGVFLGVES 
ASKRNLQFFG KGRMSDHAER AVRYLHDNDI IVSTGLIGGN PDDTAEDMWA NFHLARQLKV 
DFPIFYINTP YPKTPMREEL ERMGLITNND FRFYDGLHAN VRTKHLSAEE VQYITWEMNA 
RYYNWEWFKY NKVKRLYPRW FAREALRLAP IYAKRKLELL LRIKSRRDMF REDLARGELC 
KGVA