Gene Msed_0632 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0632
Symbol
ID	5103792
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	577891
End bp	578862
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	47%
IMG OID	640506536
Product	thioredoxin reductase (NADPH)
Protein accession	YP_001190731
Protein GI	146303415
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0492] Thioredoxin reductase
TIGRFAM ID	[TIGR01292] thioredoxin-disulfide reductase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00998267
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.636604
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCTCA TTCCACGCTC AACGAATATT AACCCAAACG AGAAATTTGA TACCATCATT 
ATTGGTCTTG GTCCAGCAGC CTACAGTGCT GCACTATACG CAGCTAGGTA CATGCTAAAG 
ACGCTTGTAA TAGGGGAGAC GCCAGGAGGT CAGCTAACTG AGGCAGGAGA AGTGGATGAC 
TACCTGGGCC TCATTGGCGT TCAAGCGTCG GAAATGATAA AGTTATTCAA CGCTCATGTA 
GAGAAATACA AGGTACCTGT TCTCATGGAC AGGGTAGAGT CCTTTAAAAG AGAGGGCGAG 
GAATATGTGG TCAAGACCAA GAGAAAGGGA GAGTTTAGGG CTTCTACACT AATAGTAGCA 
GTGGGAACCA AGAGGAGGAA ACTTAATGTT CCAGGTGAGA ACGAGTTTAT AGGTAGGGGT 
GTCTCCTACT GCTCCGTGTG TGACGCCCCA CTCTTCAAGA ATAGGCCAGT AGTTGTAGTG 
GGGGGAGGAA ACTCGGCGTT GGACGGGGCC GAGCTACTTA GCAGGTACGC GACCAAGGTT 
TACCTTGTGC ATAGAAGGGA AGAGTTTAGG GCTCAACCAA TAATAGTGAA ACTGGTTAAG 
GAGAAACCAA ATGTGGAGTT GATCCTGAAC TCCGTGGTCA AGGAAATTAA GGGAGATAAG 
CTTGTCAGGA AAGTTGTGGT ACAGAATATG AAAACCGGCG AGGTAAGGGA GATAGATGCC 
AATGGAATAT TCGTGGAAAT AGGATTTGAA CCCCCCACTG AGTTCGCTAA GATTAACGGA 
CTAGAGGTGG ACGAACAGGG TTACATAAAG GTAGACGACT GGACAAGGAC TAACCTACCA 
GGGGTTTTCG CTGCAGGGGA CTGCACCAAC AAGTGGATTG GATTCAGACA GGTTGCAACG 
TCAACAGCAA TGGGCGCGGT TGCGGCACAC TCAGCTTATA ACTATTTGAA CGAGAGAAAA 
GGTAAAACAT GA

Protein sequence

MSLIPRSTNI NPNEKFDTII IGLGPAAYSA ALYAARYMLK TLVIGETPGG QLTEAGEVDD 
YLGLIGVQAS EMIKLFNAHV EKYKVPVLMD RVESFKREGE EYVVKTKRKG EFRASTLIVA 
VGTKRRKLNV PGENEFIGRG VSYCSVCDAP LFKNRPVVVV GGGNSALDGA ELLSRYATKV 
YLVHRREEFR AQPIIVKLVK EKPNVELILN SVVKEIKGDK LVRKVVVQNM KTGEVREIDA 
NGIFVEIGFE PPTEFAKING LEVDEQGYIK VDDWTRTNLP GVFAAGDCTN KWIGFRQVAT 
STAMGAVAAH SAYNYLNERK GKT