Gene Ssol_0549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0549
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	495833
End bp	497146
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	37%
IMG OID
Product	peptidase M20
Protein accession	ACX90825
Protein GI	261601222
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGACGAGG AACTTTATAC TTTAATTGAA TTTCTAAAGA AACCCTCCAT ATCTGCAACT 
GGAGAGGGAA TAGATGAAAC AGCAAACTAT CTTAAGGAAA CTGTTGAGAA GTTATTAGGT 
GTAAAGGCGA ATCTTGAGAA GACTAAAGGT CATCCCGTAG TATACGCTGA AATTAACGTT 
AATGCCAAAA AGACACTACT TATTTACAAC CATTATGATG TCCAACCGGT GGATCCAATA 
AGTGAGTGGA AAAGAGCGCC CTTTTCAGCA ACAATTGAAA ATGATAGAAT TTACGCTAGG 
GGAGCCTCTG ACAATAAAGG AACATTAATG GCAAGACTAT TTGCTATTAA ACACTTACTA 
GATAAGAACG AATTAAATGT TAACGTGAAG TTACTTTACG AGGGAGAAGA GGAAATAGGT 
AGTGTGAATT TGGAGGACTA TATCGAAAAG AATACAAATA AACTGAAGGC AGACTCAGTC 
ATAATGGAGG GAGCTGGCTT AGACCCCAAA GGAAGGCCAC AAATAGTACT AGGGGTAAAA 
GGATTATTAT ACGTTGAACT AGTTCTTGAC TATGGAACTA AAGATCTACA CTCTTCTAAT 
GCACCATTAG TCAGAAATCC ATGCATAGAT CTAGCTAAGA TAATATCTAC ATTGGTAGAC 
ATGGGAGGAA GAGTGTTAAT TGAAGGGTTT TATGATGACG TGAGAGAATT AACAGAAGAG 
GAAAGAGAGC TAATAAAGAA ATACGATATC GATGTAGAGG AATTAAAGAA GGCGTTAGGG 
TTTAAGGAAT TAAAGTATAA TGAAAAGGAA AAGATTGCTG AGGCATTACT AACTTACCCA 
ACATGTAATG TTGATGGGTT CGAATGCGGG TATACTGGAA AGGGTAGCAA AACTATCGTA 
CCACATAGAG CATTTGCAAA ATTAGATTTT AGGCTAGTAC CTAATCAAGA TCCATATAAA 
GTTTTCGAGT TACTAAAAAA ACACCTTCAA AAGGCTGGTT TCAATGGGGA GATATTAGCA 
CATGGCTTTG AATATCCTGT TAGAACTTCG GTTAACTCTA CAGTAGTCAA AGCAATGATA 
GAATCCGCTA AAAAAGTATA TGGTACTGAA CCACAAGTAA TTCCTAATTC AGCCGGCACT 
CAACCCATGG GGTTGTTTGT GTATAAGCTA GGGATAAGGG ATGCAGTTAG CGCAATAGGT 
GCTGGAGGAT ATTACTCAAA TGCTCATGCA CCCAATGAAA ACATTAAGAT AGATGACTAT 
TATAAAGCTA TAAAACATAC CGAGGAATTT CTAAAATTAT ACCCAATACT ATAA

Protein sequence

MDEELYTLIE FLKKPSISAT GEGIDETANY LKETVEKLLG VKANLEKTKG HPVVYAEINV 
NAKKTLLIYN HYDVQPVDPI SEWKRAPFSA TIENDRIYAR GASDNKGTLM ARLFAIKHLL 
DKNELNVNVK LLYEGEEEIG SVNLEDYIEK NTNKLKADSV IMEGAGLDPK GRPQIVLGVK 
GLLYVELVLD YGTKDLHSSN APLVRNPCID LAKIISTLVD MGGRVLIEGF YDDVRELTEE 
ERELIKKYDI DVEELKKALG FKELKYNEKE KIAEALLTYP TCNVDGFECG YTGKGSKTIV 
PHRAFAKLDF RLVPNQDPYK VFELLKKHLQ KAGFNGEILA HGFEYPVRTS VNSTVVKAMI 
ESAKKVYGTE PQVIPNSAGT QPMGLFVYKL GIRDAVSAIG AGGYYSNAHA PNENIKIDDY 
YKAIKHTEEF LKLYPIL