Gene Msed_0288 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0288
Symbol
ID	5104924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	244179
End bp	245264
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	46%
IMG OID	640506194
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001190389
Protein GI	146303073
COG category	[C] Energy production and conversion
COG ID	[COG0723] Rieske Fe-S protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.37556
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.576557
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATTTTT ATTTTGTTTT CATCAGAAAG ATCAAGAGAG ATAAATTTGA TAAGATCTAT 
TATAACAAAA TATTTAAACC TTTCACTCAA CAAACATTTA ATGTGATAGT TATGGGTAGG 
CATTTCGCGC TGAAGAGGGA CGATTTCATT TTTGCTACAA GATTGATAAG AAAAATGCGA 
GATCCCAAGA CGAAGTTCGA CGAGAAAAAG TTTGCTGAGA AAGGGAGAGA TTACCTATAT 
AATTACGCCG AGGAAAAAGT AGGTCCATTA AGCCCTGGAA GGAGGATGTT CCTCAAGGGA 
ATACTTATTG GGATAGGCGC GCTTGCGGTG GCTAGCGCAG TCCCCGTTAT CTCCTATCTT 
AATCAGCCCC CTGTCTACAT CAAAAACTTT CCATGGATAA TTATAGTCGA TTCTGATGGC 
AACCCCATCG AGGCGTCTAA TCTACAGGTC AACGATCCCT CCATCCTGTT GTTCCAGTAT 
CCCATGGAGG GAGACATAAC CTTCCTCATA AACATGGGTG ACGCAAACGA CAACCCTGTG 
GCGATTCCCT CAACTAATGT TGTGATTCCC GAGGATGGTA GCACCTATAC CTTCCCTGGA 
GGGGTAGGAC CTCACAACTC CATCGTCGCG TTTAGCGCAA TATGTCAGCA CCTAGGTTGT 
CAGCCCCCTG AGATTCATTT CTATCCGCCC AAGTACCTTG CTCCGGGAGG TGTAACTCCC 
AACTATCTTC CACCCGTTGC GTACCAGGCA GCACAAAATG CAGGTGCACC CTCCGTGATA 
CATTGTGACT GCCACGGCTC TACCTATGAT CCTTCCAAGG GAGCCGCAGT CCTGACGGGG 
CCAACTCAGA GACCTCTACC CTATGTGGAG CTCTACTGGG ACCAGAATAC AGACTACCTT 
TACGCTGTAG GAATGAACCT AAAGGCTCCA GTAATCATGG GGCAGCCCTC AGACCTAGCG 
AGCTTCGCAT ATTTATCCTC GTATAATGAG CAAACTGGTT GTCCAAAGAT GCTCTTGAGC 
AAGGGCCAGA CTCCATCTCA GTGCTATTCA AAGCTTAATA ACGAGGGAGA CACATTCTCC 
TCCTAA

Protein sequence

MYFYFVFIRK IKRDKFDKIY YNKIFKPFTQ QTFNVIVMGR HFALKRDDFI FATRLIRKMR 
DPKTKFDEKK FAEKGRDYLY NYAEEKVGPL SPGRRMFLKG ILIGIGALAV ASAVPVISYL 
NQPPVYIKNF PWIIIVDSDG NPIEASNLQV NDPSILLFQY PMEGDITFLI NMGDANDNPV 
AIPSTNVVIP EDGSTYTFPG GVGPHNSIVA FSAICQHLGC QPPEIHFYPP KYLAPGGVTP 
NYLPPVAYQA AQNAGAPSVI HCDCHGSTYD PSKGAAVLTG PTQRPLPYVE LYWDQNTDYL 
YAVGMNLKAP VIMGQPSDLA SFAYLSSYNE QTGCPKMLLS KGQTPSQCYS KLNNEGDTFS 
S