Gene Ssol_1131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1131
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1055087
End bp	1056889
Gene Length	1803 bp
Protein Length	600 aa
Translation table	11
GC content	30%
IMG OID
Product	AAA ATPase
Protein accession	ACX91369
Protein GI	261601766
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTATAG AAAACTTTAC CGCAAAGATC GTTGGATTAT CAATAGTATC GCTGCTTGTA 
GTATTAATGT TTTTATACAA GTTAATATAC ATAATACCAC TTATTTTTAT AGTATTACTT 
GTATTTCAGA GTGAGAAGAA GATTTTTGCT TTTCTATCAA AGAATACAAA ACAAATACAA 
CCGTATAGTA TTGAAGATGG AGTATTCTAC AATGAAAAGA ACGCTAGTGC GGTTTTAATA 
ATAGATGATA TACAAATGGA TTATAAAGAT TTTACAAATT CTAACCTAAG ATCATTTATA 
TCATCTTTCC ATAAAATTTT AGATATAGCA AAGGATATTA ATATAGTATT AAAGAGAGAG 
AGCTTAGATA AAAACGTATA CATAGAATCA CTTTCACAGA AAATACAAGC ACTTAGAATA 
ATGATTGATA GCGATCCTTC AAATGAGAAA GCTAAAAGAA AGCTCGAGCT GATGGAAACT 
ATAATATCAA GAATCGAATC CGGCGAGAAT CCATTTAGAT ATGAAATGTA CATTATCATT 
AACTCTAGAG ATAAAAATTC TGCGTTATCT ACTGCATCCA TGATCAGACA AGGACTAGAA 
GGTCTTGGCA TAAAAACTCG GCTAGCCACA TTACATGAAA TACAGAAGTT AGTAAGGGAT 
TTTTTTCATT CAAAATTAAA TCTTAACAAG ATTGCATTAC CTACTCAGAT TCCATATCTA 
ACACCGATAT CCGTAGAGAA AAAACCCAAA AGTAGTATTA TAATTGATGG AGTACTACTA 
GGAAAAGATA TAAATAATAA TGGATTAGTA TTTTGGAATA TAACCAAAAG CCAGAACAGT 
CATCTATTAA TTGTTGGACC TACTGGTTCA GGTAAGACCG AGTTTTTAAT CTGGCTTTCC 
ACAATACTAA ATCTGATCTA TGGAGGCACC GTAATCCTAT TTGACGTAAA AGGGGATATA 
AAATATAGGC TTTCTATGTA TAAAGTGCCA TTTCAGTTAA TAAATCCGTT ATTTTATAGG 
CTAGGACTTC TTGATGAGTA TGATATCCCA ATTAGGATTA AGTTACTTCA AATCGAGAAA 
ATACTTCTTA ATTCTTTCAG ATTAAGCAAG TTTAACTCCT CCATTTTATA CAATTATCTA 
AATAGATTAA TAGATATTAG CTACTTAAAA TATAGAATTA AATGGAAAGA TTTAGAGAAA 
TACTTAAGTG AAATAGATGA TGTACAACTA AAGTACTATC TAAGCAAATT AATAAACATC 
TTATCCTCAA TGGAAGATTC GGAATTACCA CCTTTATTAC ATGGAGTTAA TGAGAATGAG 
ATTAATCTGA TAGATCTCAC TCTAATTAAG AGTGAAGAAA TAAAAAGACT CATAATATAT 
ACACTTATAC AGGAATTATA TAATAAATTT TCATTAGAAA AAATATATGA TAAACCAAGA 
GTATTCTTAG TGTTAGACGA AGCATGGACT ATTTTAAAAA ACGAATCGGA AGATTATCCA 
ATTGTGGCAG ACTTGATAAA AAGAGGAAGA GGATATGGAA TTTCCATTAT AATGGCGACA 
CAAAATTTAG AAGATCTAGG TGACCTAGCC AATATATATT TAGATAACAT AGGAGTATCA 
GTATTTATGA ATAATGGAGA TAAAAAATTC TGGGAGGAGA TAAGGAGATT CGTTAATGTT 
GATAACGATA CGTTATCTAA TAATTTGATA TTCATGAATA GAGGAGAGGC CCTCGTAAGA 
TTTTTAGGAG ATCCTAGGCC AGTAATTATA AAATTAAATA CCTTAGCCGG TAGCTCGTTC 
TAA

Protein sequence

MGIENFTAKI VGLSIVSLLV VLMFLYKLIY IIPLIFIVLL VFQSEKKIFA FLSKNTKQIQ 
PYSIEDGVFY NEKNASAVLI IDDIQMDYKD FTNSNLRSFI SSFHKILDIA KDINIVLKRE 
SLDKNVYIES LSQKIQALRI MIDSDPSNEK AKRKLELMET IISRIESGEN PFRYEMYIII 
NSRDKNSALS TASMIRQGLE GLGIKTRLAT LHEIQKLVRD FFHSKLNLNK IALPTQIPYL 
TPISVEKKPK SSIIIDGVLL GKDINNNGLV FWNITKSQNS HLLIVGPTGS GKTEFLIWLS 
TILNLIYGGT VILFDVKGDI KYRLSMYKVP FQLINPLFYR LGLLDEYDIP IRIKLLQIEK 
ILLNSFRLSK FNSSILYNYL NRLIDISYLK YRIKWKDLEK YLSEIDDVQL KYYLSKLINI 
LSSMEDSELP PLLHGVNENE INLIDLTLIK SEEIKRLIIY TLIQELYNKF SLEKIYDKPR 
VFLVLDEAWT ILKNESEDYP IVADLIKRGR GYGISIIMAT QNLEDLGDLA NIYLDNIGVS 
VFMNNGDKKF WEEIRRFVNV DNDTLSNNLI FMNRGEALVR FLGDPRPVII KLNTLAGSSF