Gene Ssol_1961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1961
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1745404
End bp	1746762
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	36%
IMG OID
Product	pyruvate kinase
Protein accession	ACX92172
Protein GI	261602569
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAAGA CTAAAATAGT TGCTACTTTA GGTCCTTCCT CAGAGGAAAA AGTAAAAGAA 
CTGGCAGAAT ACGTTGATGT TTTTAGAATA AATTTTGCAC ATGGAGACGA AACATCTCAT 
AGGAAGTATT TTGATCTTAT TAGAACATAT GCACCGGAAT CTAGTATTAT AGTAGATTTG 
CCAGGGCCTA AGTTGAGACT AGGAGAACTC AAAGAACCAA TAGAGGTGAA GAAAGGAGAT 
AAGATAGTTT TCTCTCAAAA AGATGGAATT CCAGTTGATG ATGAGTTATT TTATTCGGCT 
GTAAAAGAAA ACTCGGATAT CTTAATTGCA GACGGAACAA TACGTGTGAG GGTTAAGTCA 
AAAGCTAAGG ATAGAGTAGA GGGAACCGTA ATAGAGGGTG GAATTTTATT ATCGAGAAAA 
GGAATAAATA TTCCTAATGT CAATCTAAAA TCTGGGATAA CGGACAACGA TTTAAAACTT 
TTAAAAAGAG CTTTAGATCT GGGAGCAGAT TATATAGGAC TCTCTTTTGT AATAAGTGAG 
AATGATGTAA AGAAGGTAAA GGAATTTATA GGTGATGAAG CTTGGGTTAT CGCGAAGATA 
GAAAAAAGTG AGGCATTAAA GAACTTAACC AATATCGTTA ATGAATCGGA TGGAATAATG 
GTAGCCAGAG GCGATTTGGG GGTTGAGACT GGCTTAGAAA ATCTGCCTTT AATTCAAAGG 
AGAATAGTAA GGACTTCAAG AGTATTTGGC AAACCCGTCA TTTTAGCAAC TCAAGTATTA 
ACTTCGATGA TAAACAGCCC TATACCTACC AGAGCTGAGA TTATAGATAT TTCTAACTCG 
ATTATGCAGG GAGTGGACTC TATAATGTTA AGCGATGAAA CAGCCATAGG CAATTATCCA 
GTTGAAAGCG TAAGAACTCT TCATAATATC ATAAGTAATG TAGAAAAGAG TGTAAAACAT 
AGACCAATCG GACCACTAAA TAGTGAGAGT GATGCGATAG CTCTAGCTGC TGTAAATGCA 
AGTAAAGTAT CTAAGGCAGA TGTAATAGTA GTGTATAGTA GATCAGGTAA TTCAATATTG 
CGCGTATCGA GACTGAGACC TGAACGTAAC ATAATAGGAG TCTCTCCTGA TCCTAGACTA 
GCTAAAAAGT TTAAGCTTTG TTATGGTGTA ATACCCATTA GTATAAACAA AAAGATGCAG 
TCCATAGACG AGATAATAGA CGTCTCAGCC AAGCTAATGC AGGAAAAAAT AAAGGACTTA 
AAATTTAAAA AAATCGTTAT AGTAGGAGGG GATCCTAAAC AAGAAGCGGG GAAGACTAAC 
TTCGTTATAG TTAAGACACT AGAACAACAA AAGAAATGA

Protein sequence

MRKTKIVATL GPSSEEKVKE LAEYVDVFRI NFAHGDETSH RKYFDLIRTY APESSIIVDL 
PGPKLRLGEL KEPIEVKKGD KIVFSQKDGI PVDDELFYSA VKENSDILIA DGTIRVRVKS 
KAKDRVEGTV IEGGILLSRK GINIPNVNLK SGITDNDLKL LKRALDLGAD YIGLSFVISE 
NDVKKVKEFI GDEAWVIAKI EKSEALKNLT NIVNESDGIM VARGDLGVET GLENLPLIQR 
RIVRTSRVFG KPVILATQVL TSMINSPIPT RAEIIDISNS IMQGVDSIML SDETAIGNYP 
VESVRTLHNI ISNVEKSVKH RPIGPLNSES DAIALAAVNA SKVSKADVIV VYSRSGNSIL 
RVSRLRPERN IIGVSPDPRL AKKFKLCYGV IPISINKKMQ SIDEIIDVSA KLMQEKIKDL 
KFKKIVIVGG DPKQEAGKTN FVIVKTLEQQ KK