Gene Ssol_0018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0018
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	16455
End bp	18068
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	36%
IMG OID
Product	protein of unknown function DUF87
Protein accession	ACX90324
Protein GI	261600721
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.989354
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGATGG AAAGGGGAGA GATTATAGGA ATAGTACTGC AGAAGAGCGA AGCAAATGAA 
ATGCAAGGAC TAATTAGAGC TGATGAGGAA ATAAGCGTAG GACAATTGTT ATTAGTTGAT 
GATTCCGAGA AGCTTTCACT AGTCAGGGTT GAAAATTACG AATTTCTGAA TGAGTTCTTT 
GACGAAAAGG GGGAGATAGC TAAGTCAATA TTAAAAGAAC CTTCGATATA TGAAATTCTC 
GATATGAATA CAATAATAAA AGCAACTTTG CACTTAATAA AAAAATATGA CCATAATACA 
ACCCCTAAAC CTGGCTCTTT CGTAAGAAGA TTACCAGAAA TAAAGAGTGA AAAAGAGCTA 
CTTTCCTTTT ATGGAATAAA AAACAAAAAA GGATTAATTG AGTACGGAGC CTTAGCAGGT 
TCTGAAATAC CATTATTGTT AGACCTTAAT GCAATAACAA TGCACATGGG AGTTTTTGGA 
GAGACTGGAA GTGGAAAAAG CTACAACATG AGATACTTAA TTAAGCTTTT ATCTAACATA 
AAAATAGGAG ACAAGATCAC GGCCTTACCG ATGATTGTAA TTGATGCGAA TGGGGATTAC 
ATAGATTTAG CTTCGACAAA TCTAGACATA GTATCTAAAG GAAGAGGCTG GATAAAGAGG 
TATATATTGA AGGATCCTAA GGAGCAAAAC GACATTAAGC TTACAATAGA TTTGTCCATA 
TTCACGCCTA GAGAATTATC AGAATTTATT ATGTCTCTAA AATACGGTGA GGCTTCATAT 
AACACACTGC AACTAAATTT CCTAGAGCAA GTTTTAGCAA ACCATGAGAG CAAGGAATAT 
AATACCCTTT TAGGTAGTGC AATAGGAATT GAGACCCTAA GGAATGAGAT TCTTACGATG 
GCTCAAAATA AGGATATAGG AATCACAACG GGTACTGCTA GGGGAATTGC TAGCGCATTA 
GAAATATTCA AAAACAAAGT AATTAGCAGA CTACAACTTG TCAACTCTTC TGCATCTTTG 
ACTGAGAACA CATTAGAAGT GATTTGGAGG AATAGAGGTT TAGCAATAAT AGACTTCTCG 
GCTGATGGTT CACCAGGAGT AGATGTCCTT ACGAAACAAC TCATCGTAAG CTACATAACT 
AGATTAATAT TTAATTATCT TACGAGATCC AAATACAACG GTAATCAAAG GTTTTTGGGA 
TTTGTGATAG AAGAGGCACA GAACTACATA CCTTCTATTG ATTATCCAGT AAACGCTAAC 
TTGACAAAAG ACGTATTGGT AACACTAGCT ACTCAAGGAA GAAAATTTGG GGCATCTCTA 
ATTCTGGTAA GTCAAAGACC AGCATTTATA GATAAATACG TATTATCCAT GATTAACACC 
TTTTTCTTTC ATAGAATATA TCATGAAGAC GTAAGATATG TTATGTCCGC TTCAGGTGGT 
TTACCCGAAT CATTAACTAA GAATTTGACA TCATTAGATA CTGGATACGT AATAGTAAGT 
GGACTTATGT CAATAATGAA AAGTCCGGCA TTGGTAAGAA TCCCATGGGA TCCTAGGTTA 
GGATCATACG CTGGAAACGT GGAAAGAATT GATTTAATTT TAAGCGAAGG GTGA

Protein sequence

MVMERGEIIG IVLQKSEANE MQGLIRADEE ISVGQLLLVD DSEKLSLVRV ENYEFLNEFF 
DEKGEIAKSI LKEPSIYEIL DMNTIIKATL HLIKKYDHNT TPKPGSFVRR LPEIKSEKEL 
LSFYGIKNKK GLIEYGALAG SEIPLLLDLN AITMHMGVFG ETGSGKSYNM RYLIKLLSNI 
KIGDKITALP MIVIDANGDY IDLASTNLDI VSKGRGWIKR YILKDPKEQN DIKLTIDLSI 
FTPRELSEFI MSLKYGEASY NTLQLNFLEQ VLANHESKEY NTLLGSAIGI ETLRNEILTM 
AQNKDIGITT GTARGIASAL EIFKNKVISR LQLVNSSASL TENTLEVIWR NRGLAIIDFS 
ADGSPGVDVL TKQLIVSYIT RLIFNYLTRS KYNGNQRFLG FVIEEAQNYI PSIDYPVNAN 
LTKDVLVTLA TQGRKFGASL ILVSQRPAFI DKYVLSMINT FFFHRIYHED VRYVMSASGG 
LPESLTKNLT SLDTGYVIVS GLMSIMKSPA LVRIPWDPRL GSYAGNVERI DLILSEG