Gene Ssol_2223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2223
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	2001631
End bp	2003385
Gene Length	1755 bp
Protein Length	584 aa
Translation table	11
GC content	38%
IMG OID
Product	sugar isomerase (SIS)
Protein accession	ACX92412
Protein GI	261602809
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.22495
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAGGAA TTTTCGCTTT CGTATGCAAG GATTCCATTG ATGTTTCAAT TATTAACAAG 
GGTTTAAAGA AGTTGATTTA TAGGGGATAT GATAGCGCTG GTATTGCTTA CCTTGAAGAC 
GATAGCTTAG TAATAAAGAA AATTTTAGGT AATATCTCAA AGAATGAGAT AAGCGTTAGT 
GACAAGGCAA GAGTTGCAAT AGGTCACACT AGATATGCGA GTAGGGGTTG GCCAACTTTG 
GAAAACGCTC ACCCACTGAC TGATTGTAAT GGGAAGATAG CAGTTGTAAT GGACGGTATT 
CTTGACGATT ACGAAAAAAT TAGGGAAGAT CTGATTGCGA AGGGACATAA ATTCGTCTCT 
ACAACTGACG CTGAGGTGAT TCCCCACTTA CTTGAGAATT CAACAAACTA TCTAAACTCA 
TCATTAAACG TTATGAAAAG GGTAAAGGGC ATTTACTCTC TGGTTTTTGT AACCATAGAC 
ATTGATAAAA TATTCGCAAT TAACTCTGGC CAACCCTTGA TGATAGGTAT CACACAAGAG 
TGTAAATACG TTTCTAGCGA TTTACCCTCT TTGAGCGGTT TTGCTGAGAA TGCGATAATA 
ATGCCAGAAA ATACTGTGGC AGTAATCTCT TGGAATGATG TGCAAGTGTA TAATATTGAA 
GGTAATGAGG TAAAACCGGA AATTAAGAGA GTTAAATACA AGGAGGAGAT AGCTGAAAAG 
GGTGGATTTC CACACTTCAT GTTAAAGGAG ATATACGATA TCCCACAAGC GTTAATAAAC 
TCATTTAACT CTCTAATGGA AAAGTACCTT TCCTTAGCCT CAATGATAGT ATATGGTGCC 
AAGAACGTCT ATATAATAGG TAATGGGACT AGTCTTCACG CTGGATTTAT CTCATCATAT 
TACTTTTCTG AAATTAGCCT AAATGTTAAT GTTGTAAGTG CAGCGGAGTT TCCCTATTAC 
GCCTTGAAAA ACGTGACTAC TGGTTCGGTA ATTATTGCTA TAAGTCAAAG TGGGGAGACA 
AGTGATGTTA TAAGGAGTAT TAAAATGGCT AAGCAAAGAG GGGCTGTAAT ATTAGGTATA 
ACCAACTCTG TAGGTTCAAG ATTAGCCTTA GAATCTAACG TGTACTTACC AATAACTGCT 
GGGCCAGAGA TGGCTGTACC AGCGACAAAA ACTTTCACTT CAACTATTGT AGTATTAAAA 
GTGCTTTCGC TATACACTGG ACTTCACTCT GGTAAAAACG ATAGGAGTGA GATCAGTTCG 
TTAAAAAGTG AGATTGAAGA ATTGGCTAAA CAGTTAATGG TAAGGTTACC GGAGATGGAG 
AAAGAGGCAG AGAAATTGGC TCCTAAATTA GACAAGGAAA GCTTATACAT TTCGAGTAGT 
GGTATAAATT ACCCCATAGC CCTAGAAGGA GCTTTGAAGT TTAAGGAAGC TTCGATGACT 
CACGCAGAGG GGATTCAGCT GGGAGAACTC CTCCACGGTC CCATTGTTCT AACAAATAAA 
GGTTACCCCG TAATTTTAAT AAAACCTGTG GAGGCTGAGG ATTTATATAA CAAGGTTATT 
AGATCTATAA AGGAAAGAGG AGATGTAATT GTGACCGTTG CTGAAGATGG TGATATGAAA 
AGTATAAAGG CTACTAGGGA TTTAACTCCC ATAAGCAATG TAATACCGTT ACACTTATTG 
GCCTATAAAC TGGGAGTTAG GAAAGGGTTG CCGATAGATA CTCCTCCAGG GTTAGTGAAA 
GCTGTGATAG TTTAA

Protein sequence

MGGIFAFVCK DSIDVSIINK GLKKLIYRGY DSAGIAYLED DSLVIKKILG NISKNEISVS 
DKARVAIGHT RYASRGWPTL ENAHPLTDCN GKIAVVMDGI LDDYEKIRED LIAKGHKFVS 
TTDAEVIPHL LENSTNYLNS SLNVMKRVKG IYSLVFVTID IDKIFAINSG QPLMIGITQE 
CKYVSSDLPS LSGFAENAII MPENTVAVIS WNDVQVYNIE GNEVKPEIKR VKYKEEIAEK 
GGFPHFMLKE IYDIPQALIN SFNSLMEKYL SLASMIVYGA KNVYIIGNGT SLHAGFISSY 
YFSEISLNVN VVSAAEFPYY ALKNVTTGSV IIAISQSGET SDVIRSIKMA KQRGAVILGI 
TNSVGSRLAL ESNVYLPITA GPEMAVPATK TFTSTIVVLK VLSLYTGLHS GKNDRSEISS 
LKSEIEELAK QLMVRLPEME KEAEKLAPKL DKESLYISSS GINYPIALEG ALKFKEASMT 
HAEGIQLGEL LHGPIVLTNK GYPVILIKPV EAEDLYNKVI RSIKERGDVI VTVAEDGDMK 
SIKATRDLTP ISNVIPLHLL AYKLGVRKGL PIDTPPGLVK AVIV