Gene Msed_0059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0059
Symbol
ID	5104251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	54355
End bp	55953
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	43%
IMG OID	640505956
Product	hypothetical protein
Protein accession	YP_001190160
Protein GI	146302844
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.383995
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCATGG AAAAGGATAG TACAGGTGCT ATTTCAGAGA GAGTTGCGTA CAGAATTTAT 
TTGAAATTGA GGTATCGCGA ATCTCACGAA TCCTACATTA TCTTGACTAA ACTGGAAATA 
ACGGTGAAGA GGGAACGAGA CTCAAAGATA GAGGCAGAGG TCAGGGCAAT AGCAGAGGAT 
GGTAAAGTCT TCTCTGTTCA GTTTAACCGG CTTAGGATAA ATTCCACCGT GTTATCCAGC 
GTCGCTGAAC CAAAGGAGGA AGAAGGTCAG GTAGAAGGGT TTCAGCTAAA GGTGATTGAT 
CTCCTCAATC TCGCAATTTA TCTGGCTGAG TCAGGGAAAC CTAGATACGT ATACTTTAAC 
ATGTCCGGTG AGATGAGGAT TACCCAGTCT CAAATCCAAG TTGATAGCCT GGAGATCGTA 
GACAATCTCT CCATCACCAG AACGAGAATA TTCTTCAAGC ATGAAGATTC CATGAGGGGC 
CTCAGAAAAC ATGAATATAC AATCTGTAAC AACACGGATT TTCCCGTAAA ACATGTCTAC 
TTCAAGTTAG ATAGTTACGT CAGAGGTTTA CGTGTGGAGG AGAACCGTGA GTCTCTCATC 
TTGTTAACAA ATGGCCAACT GAGGGAACTA TTAGGCGAAG ATGTGAACAG GGTTGAGTTC 
ACTGTGATTG CTGAGTTGGA GAGAGAACTT AATCCTGGAG AGTGTCGTAT AATAAGCTTC 
AAGGGATATG ATGAGATAAG GAGAGACCAG AAAGGGTTCG AGATAAAGAT ACAGCTATTT 
GGGAACATAA CGGAGGGTAT AGTAATAATA CCGCCTAGAG GTTACAAGGT GATTAGTAAT 
CTGGGAAAAA TCAGCTTTAC CCGTTTGGAG GAGGAGAGAC CCGAAGAAAA AACGGTGAGT 
TTAGATAATT GGAATAAGAG GAAGGTTGAA CTTTTCCCTG GCGTCAAGTT GGACTTATTC 
GGTAACCCAG AACCCGTTAA TGGGGTAATC GAGTCCAATA GTGCCATAGA TATGCAGTTT 
AGAACCGAAA TCGATTCAAA GGGGACCCAG GTCTACGTTA AGGTTACGTA CAATCTAGAG 
TTTCAATACC TTAGCTTTTG GAGGTCTTTT CTTTGGTTGA TGAACATGTT GTTGTGGGGA 
CTCTTTCTAC AGGAGTTTGT GGTGCACCTG GGGGAAACAT TCAAGCTTCT GGGAATCCCT 
GGGTTCGAAA TATCGTCTTT TGGGTTTAGT TTAGCGTTCT TGCTTGGCCT AGTGGTAGGA 
CTGCTTTCCT TCCCGTATTA CATCCAGGCC AACATAGGTT ACGTTGGTAA GGCCATACGA 
TCCTTGCTGG GGAGGTTATC AAGGAGACAA CCAGAGGCTA TATCCTTACT CGTCATAATG 
ATCATGACAA TTGTGGGCCT ATTAGGGGAG TTTGGATCTA TTAAAGGAAA TCCCTTGAGC 
TACGTTTCGT TCGCGTATCT AGAAATAGAG TTTGCAATAG TGGTGGTCTT AGAACTGGCC 
TTCGTTTTAG TGGAGAGGGA GTTGAGAGAG GAGTATAGGA ATGTACTCCT GGTTCTCGTA 
ATCTTATCTG TTATATCCAT GCTTCTAGCG GTGCCATAA

Protein sequence

MSMEKDSTGA ISERVAYRIY LKLRYRESHE SYIILTKLEI TVKRERDSKI EAEVRAIAED 
GKVFSVQFNR LRINSTVLSS VAEPKEEEGQ VEGFQLKVID LLNLAIYLAE SGKPRYVYFN 
MSGEMRITQS QIQVDSLEIV DNLSITRTRI FFKHEDSMRG LRKHEYTICN NTDFPVKHVY 
FKLDSYVRGL RVEENRESLI LLTNGQLREL LGEDVNRVEF TVIAELEREL NPGECRIISF 
KGYDEIRRDQ KGFEIKIQLF GNITEGIVII PPRGYKVISN LGKISFTRLE EERPEEKTVS 
LDNWNKRKVE LFPGVKLDLF GNPEPVNGVI ESNSAIDMQF RTEIDSKGTQ VYVKVTYNLE 
FQYLSFWRSF LWLMNMLLWG LFLQEFVVHL GETFKLLGIP GFEISSFGFS LAFLLGLVVG 
LLSFPYYIQA NIGYVGKAIR SLLGRLSRRQ PEAISLLVIM IMTIVGLLGE FGSIKGNPLS 
YVSFAYLEIE FAIVVVLELA FVLVERELRE EYRNVLLVLV ILSVISMLLA VP