Gene Msed_0582 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0582
Symbol
ID	5103742
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	535982
End bp	537427
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	47%
IMG OID	640506486
Product	hypothetical protein
Protein accession	YP_001190681
Protein GI	146303365
COG category	[S] Function unknown
COG ID	[COG3372] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.566185
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.500457
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTACCAA GTGAACTTGC CAGGTTCAGG ATTTACGGAG ACGTTATCTA TCCCTCATTC 
GCTGGGGAAA GGGAAGTTGA ACTAGTCAAG GAGATGATTC CCTTCTATAA GGTTGGGATC 
ACGTACGGTG AGGTTGAGGA GAACGTAAAA CTCATGGAAA GGATGTACGG TAAGACGACT 
CAGGGAGCTA AGCTGGTGAG AGGTCTTCAT AGGGTCATCT CGAGGTACCT TACCCTATCT 
GGTGAATCTC CCGTGGATCC CAGGAAGATA AGGGAGGAGC TCTTTGCTAA GGGACCTGCC 
CTGACTCCAG AGGAAAGGGA AAGGAGACTA AGGGAGGTAA GCGAAAGGCT AGGGGTAGAC 
GCTGAGAGGT TCATGTTTGG GGATATGGAT GAGAGCAAGG TAATCTCCAG GGTTGAGATA 
CCGCCTCCGG AGGACATAGT TAAGGAGTAT AACCTTTCCC TACTGCAGAC AATACTTTTC 
AGGTCGTACA AGGTAACCTT GACCACTGAG GGGAACTGGA AGGAACTTCT GAGAACTGTA 
AAGAGACTTG GGTTGATGTA TACTGCGTAC TCTAACCCCG TGAGGATAGA GGTGATGGGT 
CCCTATACCC TTCTGAAGCC CTCAGAGAAA TACGGAAGGA ATCTGGCTAT CCTGGTTCCT 
TACGTGATTG GGACTGGAGG ATGGAGCATT GAGGCTGAAA TCATTCTAGG AAAGAGGAAG 
AGAAGGGTTT ACCAGATGAA GGTAAGCAAC AACGAATGGA TTGGAGGAAG GCCAGAACAG 
GGAAAGCTCT TTGATAGTTC AGTGGAGGAG GACTTCTACT GGAACTTCAG GGGAACAATC 
AAGGATTGGA AACTGGAAAG GGAACCTGGA CCGCTCGTGG TCAACGGCAG GATATTCCTC 
CCCGATTTCC TAGCTATCAA GGACGAGATA AGGGTCTACC TTGAGGTTGT GGGCTTTTGG 
ACAGAGGAAT ACCTGAGGGA GAAGGTTAAG AAGCTTCAGG GAACTCAAGC TCTCGTTATA 
CCCATTGTGA GTGAGGAACT TGGATCCGGG AAGATAGGCG ATTTACCAGT TATTACTTTT 
AAGAGAAAGA TTGATCCAAC CAAAGTTTAC CGTGTTTTAA GGGAAATTGA GCAGTCGCTC 
CCAACTAAGA AGGTTGAATA TGAGCTAGAT GGGAGTGACG TAATATCCAT AAAGGAGCTG 
GCGATGAAGT ATGGTATCTC TGAGAATCTC CTCCGAAAAA ATCTGAGGGA ATTTCCAGGT 
TACGTTCTTC TCAAAAACTA CTACGTAAGC CAGAAGCTTA TGGAACAACT CTCCAGGGAG 
AATTTTTCAG GTAGAAAACT TCAGGAAGTC GTGAAGGAGA GAGGAGATTT CATAACCGAG 
GTCTTGGATA AGCTAGGATA TAAGATAAAG TGGATAAACA TTGCAGACGC GGTGATCACA 
AAGTGA

Protein sequence

MLPSELARFR IYGDVIYPSF AGEREVELVK EMIPFYKVGI TYGEVEENVK LMERMYGKTT 
QGAKLVRGLH RVISRYLTLS GESPVDPRKI REELFAKGPA LTPEERERRL REVSERLGVD 
AERFMFGDMD ESKVISRVEI PPPEDIVKEY NLSLLQTILF RSYKVTLTTE GNWKELLRTV 
KRLGLMYTAY SNPVRIEVMG PYTLLKPSEK YGRNLAILVP YVIGTGGWSI EAEIILGKRK 
RRVYQMKVSN NEWIGGRPEQ GKLFDSSVEE DFYWNFRGTI KDWKLEREPG PLVVNGRIFL 
PDFLAIKDEI RVYLEVVGFW TEEYLREKVK KLQGTQALVI PIVSEELGSG KIGDLPVITF 
KRKIDPTKVY RVLREIEQSL PTKKVEYELD GSDVISIKEL AMKYGISENL LRKNLREFPG 
YVLLKNYYVS QKLMEQLSRE NFSGRKLQEV VKERGDFITE VLDKLGYKIK WINIADAVIT 
K