Gene Ssol_2289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2289
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	2085163
End bp	2086773
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	35%
IMG OID
Product	peptidase S9 prolyl oligopeptidase active site domain protein
Protein accession	ACX92468
Protein GI	261602865
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATATG AAGATTTATT TAAGATAAAA CCTGTACTCG ATTACGACGT ATATAACGGA 
AAAATAGCAA CAATTATAAG AGATGAAAAA CCCGTCCTTT ACGTCAACAA GGAAAAAGTC 
CAACTCGAAG GATATGCCAA AGAAGTAGAC TGGATAAATA GAAACAAAAT GTTTATCACA 
GTAGACCCTA ACGGTAGTGA AATTAGGAAA ATTTACCTTT ACGATAACGG GAAGATAGAG 
AAAATTATTG ATAATGAGTT TGATAATTTA TCTCCTCGCG AGACAAACGA AGGGATTCTA 
GTAATCTCAA ACTATGATAA AAAGACATTA CATCTTTACC TCTACAATGA AGGAAAATAT 
ATTAAGCTAA GCAAGGGTGA AGGACCGGTA AACAATTACT GTTTTAATGG CAAATACATA 
GTTTACTCGA CTGGGATTTA TGATAATAAC ATTCACGTGA TGGATCTCAG TGGTAATGAA 
ATTAATGTAA TTAATATCCC AAACTCAGAG CAAGAGCTTG CAAATGAGAA TTGTTTTACT 
TCTCCTTCAT CATTCATCTT TCTCTCAAAT CACGAGGATT TATCTAAGGT TTATGAGTTT 
AATATTTTAA AGGGAGAGAT CAGAAAAATA AGGGAAAGCG ATTACGAAAT CTTTGAGGCT 
ATTCCATATA AGGGTTCTAT CGCTTATGTT GAGGATAGAC ACGGCAACTT TGTCTTAATT 
CACGAAAAAG AGATAGTTAA TGAAGGCTTT ACCTACTCCT TAAAGGTTGA TGGAGATTAT 
ATTTATTTTG TAAACTCTAA ACATGATAGA TCAGCAGACC TATACAGATA TGGGAAAAAG 
GTAGAGAGGT TAACTGACTC AATGAACGAT GCTAAAGGGA ATTTCATAAA ACCTAAGGTT 
GTCTCTTACG ACTCCAATGG GTTGAGGATT TACGCCTTAC TCTATGAAAA AGGTGGTGAG 
GATAAGGGTA TAGTTTATAT TCACGGAGGT CCAGATTGGG AATGCGTAAA CTCATTCAAC 
CCAGAAATTC AGTTCTTTAT GGAGAGAGGA TTTAAGGTTA TTTGTCCCAA TTACAGAGGA 
TCTATAGGTT ATGGAAGGAG GTTTAACCAT TTGAACGATA AAGACCCAGG AGGAGGTGAG 
TTGTTAGATG TTATAAATTC AGTGAAGGTC TTAGGAGTTA AAAAGATTGC AATAACTGGT 
GCAAGTTATG GTGGCTATTT GACCATGATG GCTACTACTA AGTTCTCGGA CCTTTGGTGT 
TCGGCTGTGG CTGTAGTACC TTTTGTTAAT TGGTTTACCG AAAAGAAGCT TGAAAGGGAA 
ATACTTCAAC TATATGACGA AATAAAGGTT GGTAATGATG AAAATTTATT GAGGGATAGA 
TCACCTATAT TCTTTATTGA TAGGATAAAA ACTTCATTGC TTCTCTTAGC TGGTGAAAAT 
GACCCAAGAT GTCCAGCTGA GGAAACTTTG CAAGTAGTTG AAGAACTTAG AAAGTTGGGT 
AGAGAAGTGA AATATAAGAT ATACAAAGAT GAGGGACACG GATTTGCAAA AATAGAAAAC 
TATGTTGACT CGATAAAAGA GGCTGTGGAG TTTATTACTA GTCACTGCTG A

Protein sequence

MKYEDLFKIK PVLDYDVYNG KIATIIRDEK PVLYVNKEKV QLEGYAKEVD WINRNKMFIT 
VDPNGSEIRK IYLYDNGKIE KIIDNEFDNL SPRETNEGIL VISNYDKKTL HLYLYNEGKY 
IKLSKGEGPV NNYCFNGKYI VYSTGIYDNN IHVMDLSGNE INVINIPNSE QELANENCFT 
SPSSFIFLSN HEDLSKVYEF NILKGEIRKI RESDYEIFEA IPYKGSIAYV EDRHGNFVLI 
HEKEIVNEGF TYSLKVDGDY IYFVNSKHDR SADLYRYGKK VERLTDSMND AKGNFIKPKV 
VSYDSNGLRI YALLYEKGGE DKGIVYIHGG PDWECVNSFN PEIQFFMERG FKVICPNYRG 
SIGYGRRFNH LNDKDPGGGE LLDVINSVKV LGVKKIAITG ASYGGYLTMM ATTKFSDLWC 
SAVAVVPFVN WFTEKKLERE ILQLYDEIKV GNDENLLRDR SPIFFIDRIK TSLLLLAGEN 
DPRCPAEETL QVVEELRKLG REVKYKIYKD EGHGFAKIEN YVDSIKEAVE FITSHC