Gene Ssol_0013 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0013
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	9461
End bp	10789
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	35%
IMG OID
Product	Peptidase A5, thermopsin
Protein accession	ACX90319
Protein GI	261600716
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATAAGG TTCTGCTCAT AATAATTCTA TTATTGCCAT TATCAATGCC CTTGAGTATA 
CCCACTACTT CACAACCTTC AGCTTTAGCT TTTCCCTCAG GAGTGACTAG TTATCCTTTG 
AATACAATAA TCTATACAGA TTTCGTTATG GGTAGGATCA ATATTTCATA TTTAAATATA 
GGTAGCTCGT ACTTACCAGG AGGAGAATAT TTCACTACTG GAAACGCATC GCTTCAGTTA 
AACGCTATGG TATTAGGAGA GTATTGGGCA CAAAATGTGA TTCTATTTCA TCAAATATCA 
AATAATACCT TTTATGCTAC ACTGATAGTA AATCTTTGGA ATCTTTCTGG CCCCTTTAGT 
AATACAACAA GTAATTCGTT AGTATATCAA GGTCTAGGTG TAATTTGCTA TCAAGGTCCA 
ACGTTCAAGG TAACCTTACC CCTTTCCATT AGCCTATTTA TGGAAATAGT TAATTCTACA 
TTAAACTTTG GATATAATAT AAATGGGCAG AAGGGAATCT ATTTCAGATA CCCTATAATA 
GGTTTATTCC AGTTAGGTGG TCTTTCACTA TTAGGGTTGC CAAATGATCT AGAGTTAGTT 
TGGGGAGGAC CAGGTGGTGG AAGTGTGGTA TTTATGAATG TGAGTAGTAT AGCCAATTTG 
TACTATTTCA ATGGGAATAC TTTAACTATT GTACCCAACG CTTACTCTAT AGGATTTGAT 
ACTGCAGAAT CGGCTTACGG GGTAAAGGTA TACTCCACTT TTCCTAGTGT ATTTTCACCT 
ATAGTGATTG AGACAAGTGG GGTTAACGTA CCTTCAGTAT TATGGCCAAT TCCTCCCCAC 
GTTTTAGTTA ATCAGACTAG TAATAAAATA ACTGTGAAGT TGTCCATAAG TAATAAGTCC 
TTATCAGGGC AAGCGGTCTA TTTGGAAACC GGATTTCCTC CTTCGGTCAT ATCTTCTGCA 
GTGACAAATT CCTCTGGAAT TGCGGTATTT CCTAATAACA ATTATTCGTT TTATGTAGTT 
TATTTTCCAG GCAATTTCAC TCTATCTTCG ACCTACTACT TCTCCTCACC AATCCTTAAT 
TCACTTTCTA GTAAGTTTCG ATCTTATTAC CAAGATTTAT TGAATTTTCT AAACTCGGCC 
CAGAATTCCT TTAAGAAAGG TATAAAGTCT GTACTATCTA AGCAAGAAAC TTCCATAACT 
ACTACCACGT TAACTTCTAC TACTTCAAGT TCTTCCCAAT TTGGGGTTAA CTTGTATATC 
GTACTTTATA TCTTAGCTTT TGTAATAGGT ATGGTAATTT CAGCAATATT AATAAGGTTC 
AAATTATAG

Protein sequence

MYKVLLIIIL LLPLSMPLSI PTTSQPSALA FPSGVTSYPL NTIIYTDFVM GRINISYLNI 
GSSYLPGGEY FTTGNASLQL NAMVLGEYWA QNVILFHQIS NNTFYATLIV NLWNLSGPFS 
NTTSNSLVYQ GLGVICYQGP TFKVTLPLSI SLFMEIVNST LNFGYNINGQ KGIYFRYPII 
GLFQLGGLSL LGLPNDLELV WGGPGGGSVV FMNVSSIANL YYFNGNTLTI VPNAYSIGFD 
TAESAYGVKV YSTFPSVFSP IVIETSGVNV PSVLWPIPPH VLVNQTSNKI TVKLSISNKS 
LSGQAVYLET GFPPSVISSA VTNSSGIAVF PNNNYSFYVV YFPGNFTLSS TYYFSSPILN 
SLSSKFRSYY QDLLNFLNSA QNSFKKGIKS VLSKQETSIT TTTLTSTTSS SSQFGVNLYI 
VLYILAFVIG MVISAILIRF KL