Gene Ssol_0790 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0790
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	730502
End bp	732109
Gene Length	1608 bp
Protein Length	535 aa
Translation table	11
GC content	37%
IMG OID
Product	thermosome
Protein accession	ACX91044
Protein GI	261601441
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCTATT TATTAAGAGA AGGAACACAA AGATCTACTG GAAATGAGGT AATACTAAAC 
AACATAGCAG TAGCGAAAAT ATTACTAGAA ATGCTAAAGT CAAGTCTAGG TCCTAAGGGC 
TTGGACAAAA TGTTGGTTGA AGGGCAAGAC GTTACAATAA CTAATGACGG TGCTACAATA 
GTGAAAAACA TGGAAGTACA GCATCCTACT GCTAAATTAC TTATTGAAAC CGCAAAAACT 
GTTGACACCG AGGTAGGGGA TGGAACAACC TCAGTAGTTG TCCTCGCTGG ATTACTGTTA 
GAAAAGGCTG AAGACTTATT AAATCAAAAG ATTCATCCAA CGGTAATAAT TGAAGGTTAT 
AGGAAAGCAC TAAATTCATC ATTAGAATTG CTAAAAAATA TAGCTGATAA GATTAGTCCA 
GAGGATAGGA AGATAGTTCA CGATTTAGTA TATACTACTC TTTCTAGTAA GTTCTTCTCC 
ACAGAGCACA CTCTCGAGAA GATAATAAAC TTGGTTATTG ACGCTTCGTT AGCGGTATTG 
GATAAAAGGG ATGGAAGTTA TGATCTAGAT ATTAAGAACA TTAAGATTGT AAAGGTCAAT 
GGCGGGGAAT TCGATGATAG TGAGCTAATA AACGGAATCG TTGTAGATAA AGAGCCAACC 
AATGAGAATA TGCCGAAAAG AGTGGAAAAC GTTAAAGTGA TGTTAGCTGA CTTTCCACTA 
AAACTTGAAA AAACAGAAAT CAGTATGAAG TTGGGAATAA GCGATCCCAC TCAGATAAAG 
GGATACTTAG ATGAACAAAC GGCTTATGTT AAGCAAATGG TGGATAAGAT AAAGGCAATG 
GGCGTCAAAT TATTTATTAC CCAAAAGGAT ATTGATGAAA TTGCTTCATA TTTAATGGGC 
AAAAATGGAA TAATGGCATT AAAGAACGTA AAGAGAAGCG ACATAGAATT ATTGAGTAGG 
GCTACTGGTG CCAAAATTGC AAGTAGTATG AAAGATGCTA ACGAAAGTGA CTTAGGGGAA 
GCTAAATTAG TAGAGGTTAG AAATTTAGGA AAGAACAAGT ATCTCTTCAT CCAATCCGAT 
AAAGCTAAAG CAGTGACTGT AATAATAAAG GGCTCAAATA ACATGATAAC TGATGAAGCA 
GAGAGAAGTT TAAATGACGC CTTCAACTCC ATAAGAAACT TACTATTGGA ACCATATATA 
GTAGCGGGTG GTGGAGCAGT AGAAGAAGAG TTAGCTAAGA GATTAAGAGA TGACGCAAGA 
AAGGTTATAG GAAAGGAGCA ATTGGCATTT AATGCATTTG CAGATGCATT AGAAGAGTAC 
GTTTCAATAC TATCAGAAAC TGCTGGTATG GATCCGATAA GCGCGTTAAC CGAAATAAGA 
CACAAACACG CAACTGGGTT AAAGAATGCT GGAATAGACG TTACTAAGGC AAGGATTTAC 
GATAATATGC TTGAACTTAG AGTGATTGAC TCTCTAAAGG TTAAGGAACA AGTTTTGAAG 
AGTGCTACAG AAGCAGCTAC TGCAATTTTA AAGATTGATG ATATGATAGC TGCAGCTCCT 
GCAAAGCAAC AACCTCAGCC ACAACAGCCA AACCCATACT TAGGTTAA

Protein sequence

MAYLLREGTQ RSTGNEVILN NIAVAKILLE MLKSSLGPKG LDKMLVEGQD VTITNDGATI 
VKNMEVQHPT AKLLIETAKT VDTEVGDGTT SVVVLAGLLL EKAEDLLNQK IHPTVIIEGY 
RKALNSSLEL LKNIADKISP EDRKIVHDLV YTTLSSKFFS TEHTLEKIIN LVIDASLAVL 
DKRDGSYDLD IKNIKIVKVN GGEFDDSELI NGIVVDKEPT NENMPKRVEN VKVMLADFPL 
KLEKTEISMK LGISDPTQIK GYLDEQTAYV KQMVDKIKAM GVKLFITQKD IDEIASYLMG 
KNGIMALKNV KRSDIELLSR ATGAKIASSM KDANESDLGE AKLVEVRNLG KNKYLFIQSD 
KAKAVTVIIK GSNNMITDEA ERSLNDAFNS IRNLLLEPYI VAGGGAVEEE LAKRLRDDAR 
KVIGKEQLAF NAFADALEEY VSILSETAGM DPISALTEIR HKHATGLKNA GIDVTKARIY 
DNMLELRVID SLKVKEQVLK SATEAATAIL KIDDMIAAAP AKQQPQPQQP NPYLG