Gene Msed_2157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_2157
Symbol
ID	5104896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	2072318
End bp	2073349
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	47%
IMG OID	640508048
Product	radical SAM domain-containing protein
Protein accession	YP_001192220
Protein GI	146304904
COG category	[R] General function prediction only
COG ID	[COG2108] Uncharacterized conserved protein related to pyruvate formate-lyase activating enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.350893
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000485535
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGAACTCCT TGCTCAAGGG AAATCCTGAG ATAGGACTTT ACAATAGGGA ATTGCCCAGG 
GGATGCGAAC TCTGTAGAAT GGGCGGTAAG ATGGTTGTGT TCATTTCTGG AGAGTGTGGA 
GACTCCTGCT ATTACTGTCC CGTTAGCGAG GGAAGGTTTG GTAAGGATTC AGCGTATGCC 
AATGAGTACA GGGTAAAGGA GTTACAAGAC TTCATTTATG AGTCCTACAG GATGAATGCC 
CTTGGTGCAG GGATAACTGG TGGAGATCCA CTACTTCACC TGGACAGGGT AGTGGAATTA 
ATTACGTTAC TCAAGGACGA ATTTGGTAGA TCTTATCACA TACACCTTTA CACCACTGGT 
AGATACGCCT CAACTGACGC ACTTTTGGAG CTGGCGAAGG CTGGTCTTGA CGAAATAAGG 
TTCCATCCTG TAAAGGACCA GTACCTTTCA GCAGTGGAGA GGGCACTCAA GGTTGGGATA 
GATGTGGGAC TGGAACTGCC AGTTATACCC GGAGAGGAGG ATAGGCTATC TAAGCTGATT 
AATTGGGCTA GGGAAAAGGG CGTGAAGTTC GTTAACCTCA ACGAACTTGA GCTAACCGAG 
AGAAATTTCC ATAGCCTCAA TTCCAAGGGT TTCAGGATAG GTCATGGGTT AGCCGGTGTA 
TCTGGGAGTT TCGAGACCTC CATGAAGGTG CTTGAGACAT TTCATGAAGC GAACATATCA 
CTTCACTACT GTAGTTCGGT ATACAAGGAT GTCGTAGAGA CTAGAACTAG GTTCATCAGA 
ACCTTGAGAG CTAGCGGTAA ACCCTACGAG GACATCACAG GAGAGGGTAC CTCATTGCGG 
GCCATAGTCA AGTCATCCGC GGATCTTTCG GATTTCGGGG AAAAGATAGG AGACACGTTT 
GTGACCAGTC CATCTCTAGT TAACGTCCTT CCCAAGGAAA AGGTTGACGA GATATGGATT 
GTGGAGGAAC TACCATATGG TCAAAGACTC TCAGAGAAAC TAGTTTATTC TAAATCTAAG 
AATGGCCAGT AG

Protein sequence

MNSLLKGNPE IGLYNRELPR GCELCRMGGK MVVFISGECG DSCYYCPVSE GRFGKDSAYA 
NEYRVKELQD FIYESYRMNA LGAGITGGDP LLHLDRVVEL ITLLKDEFGR SYHIHLYTTG 
RYASTDALLE LAKAGLDEIR FHPVKDQYLS AVERALKVGI DVGLELPVIP GEEDRLSKLI 
NWAREKGVKF VNLNELELTE RNFHSLNSKG FRIGHGLAGV SGSFETSMKV LETFHEANIS 
LHYCSSVYKD VVETRTRFIR TLRASGKPYE DITGEGTSLR AIVKSSADLS DFGEKIGDTF 
VTSPSLVNVL PKEKVDEIWI VEELPYGQRL SEKLVYSKSK NGQ