Gene Ssol_0070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0070
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	59940
End bp	61442
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	34%
IMG OID
Product	protein of unknown function DUF87
Protein accession	ACX90371
Protein GI	261600768
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAATTG GTTATGTAAT TGGTCAAGCT ACAACACAAG AGGCTTTAAT ACTAGCTGAA 
AGGCCTGTTA GATTAGGAAC TTATGTTGTT CTAGAATATG ATAACGTTAA GGCCCTTGGA 
CTAATAACAA ACGTGACTAG AGGTAGCCCT ATGCTAGATG ATAATATGAA TGATATAGAA 
ATCGTTCAAA GATTAAAACA ATTCAACAAT AGCATACCCG TTTATACAAA GGCTAAAGTA 
AAAATGTTAT GTGATATGAA TAATCACTTT TTAATGCCCG ATATACCCCC GTTCGCTGGA 
ACCCCAGCTA GAGAGGCTGA AGATGAGGAG TTAAAAAGTA TTTATTCTCA AGATGGCCAA 
ATTAGAATAG GAAGCTTAAT AGGTAAAAAT GTGGAGGTTA AATTAAATAT AAATTCCTTT 
GCAAGGCATT TAGCTATTTT AGCAGCTACT GGTTCTGGGA AGTCAAATAC AGTAGCAGTT 
CTTTCTCAAA GAATTTCTGA ACTTGGTGGA TCTGTTCTTA TATTCGATTA TCATGGAGAG 
TACTATGATA GCGATATAAA GAATCTAAAT CGTATTGAAC CTAAACTTAA CCCTCTTTAT 
ATGACCCCAA GGGAATTTTC TACGTTACTA GAAATAAGAG AGAATGCAAT TATACAGTAC 
AGAATTTTAA GAAGAGCTTT CATAAAGGTA ACAAATGGTA TAAGAGAAAA GCTAAAAGAA 
GGGCAAATAC CATTTTCTAC TCTAAATAGC CAATTTTACG AACTAATGAA AGACGAATTG 
GAAACTCAAG GAAATAGTGA TAAAAAGAGT AGTGCAAAGG ATGAGGTACT GAATAAGTTT 
GAAGAATTTA TGGATAGGTA TTCAAACGTC ATTGATCTTA CATCTTCAGA TATAATTGAG 
AAAGTAAAGA GAGGTAAGGT AAACGTTGTA AGCCTAACAC AATTAGATGA AGACTCAATG 
GATGCAGTAG TCTCACATTA TTTAAGAAGA ATCCTTGATT CTAGGAAAGA TTTTAAAAGA 
AGCAAAAATA GTGGCCTTAA ATTCCCAATA ATAGCTGTAA TAGAAGAAGC TCACGTTTTC 
TTGTCTAAAA ACGAGAATAC ATTAACCAAG TACTGGGCGT CCAGGATAGC AAGAGAGGGC 
AGAAAATTTG GAGTTGGATT AACAATAGTA AGCCAAAGGC CTAAAGGTTT GGACGAAAAT 
ATATTAAGTC AAATGACCAA TAAGATCATT TTAAAGATAA TTGAACCAAC TGATAAAAAA 
TACATCTTAG AGTCAAGTGA TAATTTAAGT GAAGATTTGG CTGAGCAATT GTCCTCCTTA 
GACGTTGGTG AGGCTATAAT TATAGGTAAA ATAGTAAAAT TACCTGCTGT TGTAAAGATA 
GATATGTTTG AAGGAAAATT ACTTGGATCA GACCCTGACA TGATAGGGGA ATGGAAGAAA 
GTCGAGGAAA GTGAAAAAAT AGCTAAAGGT TTTGCTGACT TTGGAACAGA AATTGGTGAT 
TAA

Protein sequence

MIIGYVIGQA TTQEALILAE RPVRLGTYVV LEYDNVKALG LITNVTRGSP MLDDNMNDIE 
IVQRLKQFNN SIPVYTKAKV KMLCDMNNHF LMPDIPPFAG TPAREAEDEE LKSIYSQDGQ 
IRIGSLIGKN VEVKLNINSF ARHLAILAAT GSGKSNTVAV LSQRISELGG SVLIFDYHGE 
YYDSDIKNLN RIEPKLNPLY MTPREFSTLL EIRENAIIQY RILRRAFIKV TNGIREKLKE 
GQIPFSTLNS QFYELMKDEL ETQGNSDKKS SAKDEVLNKF EEFMDRYSNV IDLTSSDIIE 
KVKRGKVNVV SLTQLDEDSM DAVVSHYLRR ILDSRKDFKR SKNSGLKFPI IAVIEEAHVF 
LSKNENTLTK YWASRIAREG RKFGVGLTIV SQRPKGLDEN ILSQMTNKII LKIIEPTDKK 
YILESSDNLS EDLAEQLSSL DVGEAIIIGK IVKLPAVVKI DMFEGKLLGS DPDMIGEWKK 
VEESEKIAKG FADFGTEIGD