Gene Msed_1999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1999
Symbol
ID	5103386
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1932931
End bp	1933986
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	46%
IMG OID	640507887
Product	radical SAM domain-containing protein
Protein accession	YP_001192063
Protein GI	146304747
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1180] Pyruvate-formate lyase-activating enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.156539
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAAGG AAGCTATACT ATACACCAAG TTAGATGGCA GGATCAGATG TGACGCCTGT 
GCCAGGAAAT GCCTCATTGG TGAGGGACAG GTTGGGTTCT GCGGAGTCAG GTCTGTCTCC 
ACGGGGAAAT TATACTTGAA TGTATACGGT AAGGTCGCAG CTGCTCACAT AGACCCCATA 
GAGAAGAAGC CCCTTGTTCA CTTCTATCCA GGTTCAAGGG TACTTTCGTT CTCCACATTT 
GGATGTAATT GGATGTGCAT GTACTGTCAG AACTACGACA TAAGTCAGAG GAGAGTGGTG 
GATGGAGCAG ATCTAATGCC TGAGGATATA GTGGATATGG CCAGGGCATA TGAGGTTGAA 
GGGATTACCT ACACATATAA CGAACCGGCA ATCTTTGCTG AGTTCGCCCA CGACACGGGT 
GTTCTGGCTA GGAAATTTGG GTTATTAAAC ACCATGGTTA CCAACGGGTA CTGGAGCGAA 
GAACTTGTGG ATTACGTTAA GGACTTTCTG GACGCAGTTA CTGTGGATTT CAAGGGAAAC 
GGGGAACCTA AGTTCATGAG AAGATACACA GGAGCCTCTG GGCCAGATCC AATCTTTAAC 
ACTATCTCAG AACTGATTAA AAGAAAGATT CACGTGGAGA TTACGGACCT AATCATTCCA 
GAAATAGGGG ATAACCTGGA ATTCGCTAAG GGATTTCTCA AGAGACTATA TGACGTGGTT 
GGACCTGATG TTCCAATACA TTTCCTCAGG TTCCACCCAG ACTACAAGCT GAACAACCTA 
CCCTTGACTC CAGTGGAGAC TCTTGAGGCA CATTACAAGA TAGCAAAGCA GGTGGGATTC 
AGATTCGCCT ACGTGGGAAA TGTTCCAGGT CATCCCCTCG AGAACACTTA CTGCCCACAG 
TGCGGTAACG TAGCCATAAG GAGATACGGC TTCAGAATAC TGGAATGGAA TCTAACTGAG 
GATATGAGGT GCACAAGATG CGGTTATAAG CTTCCCATAG AGGGAAGAAG ATCCAAACAC 
TACCGTGAGG ATAGATTCGA ATCAATCTAC ATCTAG

Protein sequence

MQKEAILYTK LDGRIRCDAC ARKCLIGEGQ VGFCGVRSVS TGKLYLNVYG KVAAAHIDPI 
EKKPLVHFYP GSRVLSFSTF GCNWMCMYCQ NYDISQRRVV DGADLMPEDI VDMARAYEVE 
GITYTYNEPA IFAEFAHDTG VLARKFGLLN TMVTNGYWSE ELVDYVKDFL DAVTVDFKGN 
GEPKFMRRYT GASGPDPIFN TISELIKRKI HVEITDLIIP EIGDNLEFAK GFLKRLYDVV 
GPDVPIHFLR FHPDYKLNNL PLTPVETLEA HYKIAKQVGF RFAYVGNVPG HPLENTYCPQ 
CGNVAIRRYG FRILEWNLTE DMRCTRCGYK LPIEGRRSKH YREDRFESIY I