Gene Ssol_0525 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0525
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	468379
End bp	469815
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	36%
IMG OID
Product	extracellular solute-binding protein family 1
Protein accession	ACX90804
Protein GI	261601201
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.180437
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCCC TTTCAACTCT TGCAATGGCT GTAATAATAA TAGTTGTAAT AGCTGTAGTG 
GCTGCTGCAG CATATCTGAT TACCTCAAGT AGTCATCATC CCTCTATTTC AACGACAACT 
ACACCGATTA TAGCTACCAA CACAACCGCA CCAATTACAT TAACAGTAGT CACATTTAGT 
GGGCAGTCTG CAAACTTTAT CCAATACGCT GGTAACTTAT TCCATCAACT ACACCCAAAT 
GTTCAAGTTG AAGTTATCCA ATATCCATTT AGCGAGTACA TTCAGAAAGA ACTTACGGCA 
CTTGAAGCTC ATTCCTCCCA ATATGATATT ATAGGCTTCA CTTCAACTTC TGCTCTAGAT 
GTCGCATCAT ATTTGTTGCC TATAAACGAG TCAGTTTTCA ATTTCTCCGA CATAATATAC 
CCTCAAGAAG ATTTTGGAGG ATTGTATTAT AACGTATCCA CTAATAAAAC TGAAGTGATA 
GGTATCGCAT ATGAAACTGC AGTTTACTTA ATGGCATATA ATGCTACAAT ATTTAATAAT 
CAAACCTTGG CACAAGAATT TGAACAAGAG TATCATATGA ATTTTTCACC AATTACATAT 
AAGAACTGGA GTGTAGTTTT AGATGTTGAT CAATTCCTAA CTTCACACCA TATCACAAAA 
TACGGTTTCC TAATAGACGA TCATGTCGCA CACGGAATTA TTGACGCATT TCCTGCAGTA 
TTTGGCTGGT ATTATTTTAG AAATAATTCA TTAAATATGG GTAATCCAGC AGGTTTACCT 
AACTATAACA TAATGTTTGA GGGTAGAATA TTACCAGGTT TTAATTATCC TCTACCATCG 
TTTAATTCTT CCTCTGGCGT GCAAGCTCTA ATTACCTATA GGGAATTAGT AAGTTATGAG 
CCCAGTCCTT CACAGATTCA AATATCGTAT GATAACCTAC CAGCATTCTT CTCTCAAGGA 
GCTGGCGCAT TTCTATTCAC ATCTCAATTA AGTTATATAA ATAACTCTAA AGATGTACTA 
CTCGCACCAT TACCTGGGGG ATATGCGGAA ACCGGAACTG ACTTTTTAGG AATTAGTAAG 
TACTCATCAC ATCCTCAATT AGCTCTAGAA TTCTTGCAAT TTTTAGTATC CCCTAAGGTG 
CAAGAGATTG CATTCCTAAA ATATGGTAAA TTCCCGATCT CTAAACAAGC GTTTCTTTCA 
CTAATAAGCA ACTCGTCACT TCCTTCTTAT AAAAGGGAAT GGCTGCAAGA GACTTATTAC 
GCAGCGTTAA ATGCCACAGC AAATCCACCA AATATTCCAC AAACATATCC TGCATTAATT 
CCAAGCTTTA ATAATGAGGC ATTTCAGTTC TTAACTTCAC CTCAATATAA TGAGACATAT 
GCTATGAACG TATTACAACA AGCTGCAAAT GCATGGATTA AGGCACTTTC TTCATAG

Protein sequence

MKALSTLAMA VIIIVVIAVV AAAAYLITSS SHHPSISTTT TPIIATNTTA PITLTVVTFS 
GQSANFIQYA GNLFHQLHPN VQVEVIQYPF SEYIQKELTA LEAHSSQYDI IGFTSTSALD 
VASYLLPINE SVFNFSDIIY PQEDFGGLYY NVSTNKTEVI GIAYETAVYL MAYNATIFNN 
QTLAQEFEQE YHMNFSPITY KNWSVVLDVD QFLTSHHITK YGFLIDDHVA HGIIDAFPAV 
FGWYYFRNNS LNMGNPAGLP NYNIMFEGRI LPGFNYPLPS FNSSSGVQAL ITYRELVSYE 
PSPSQIQISY DNLPAFFSQG AGAFLFTSQL SYINNSKDVL LAPLPGGYAE TGTDFLGISK 
YSSHPQLALE FLQFLVSPKV QEIAFLKYGK FPISKQAFLS LISNSSLPSY KREWLQETYY 
AALNATANPP NIPQTYPALI PSFNNEAFQF LTSPQYNETY AMNVLQQAAN AWIKALSS