Gene Ssol_2040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2040
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1829237
End bp	1830334
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	36%
IMG OID
Product	phosphoribosylaminoimidazole carboxylase, ATPase subunit
Protein accession	ACX92248
Protein GI	261602645
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCTCAG TACTAGACTG GAAGCCTAAA ATTGGAATAT TAGGAGGAGG ACAGCTCGGC 
TGGATGATAG TATTAGAGGG TAGAAAATAC CCATTTACTT TTTACGTATT AGAGAACGAT 
AAGAATGCTC CAGCTTGCAG AATTGCAGAT AGGTGTTTCT CTCCTCAAGA TTATAAGGAA 
TTCGTTGATT CCTCAGACGT TATAACATTT GAGTTCGAAC ACGTGTATGA AAAGGCATTA 
GAGTATGCTG AGTATAGTGG CAAGCTATTA CCTAGACTTA ACTCTGTAGA GTTGAAGAGA 
GAGCGTTATA AGGAGAAGCT GTTCTATAGA CAACATAATT TACCAACTCC TAGATTCTAT 
GTAGCAGAGG ATGGTGAGGA AGCATTAAAG ATATTAAGAG AGGAATTCAA TAATGTCGGA 
GTTATTAAGG AATCTAAAGG AGGATATGAT GGTAAGGGGC AATATTTCAT CTTTAATGAC 
GTTGAGAAAT ATCAATTTCT AAGGGAAAAG AAAGAGAAGA TGGTCGTTGA GGAGTATGTA 
AAATTTGATT TTGAGGCCTC CATTATTATA GCAAGGGATA AGAGAGGTGT TTTTATTAGT 
TACCCTCCAA CTTATAATTA TAATGAAAAA GGTATTTTAG TTTATAATTA TGGGCCGTAT 
AATAATCAGA ATATAGTAGA GATTGCAAGA AGGTTAAGTG AGGAGTTGGA TTACGTAGGA 
ATTATGGGCG TTGAGGTATT CGTAGTTAAC GGTAAAGTTT TAATTAATGA GTTTGCCCCA 
AGAGTTCACA ATACTGGGCA CTATACTCTT GACGGCGCTC TAATCTCTCA ATTTGAACAA 
CACCTAAGGG CAATAATCGG TATGGAGTTA GGTCCATCTA CCATCTTATC TCCTAGCGGG 
ATGGTTAATA TTCTTGGTAC AGATAAAATA CCAGTTGAGG TATTAAAATA CGGTAAAGTT 
TACTGGTACT CTAAGAGTGA AGTTAGGAAG AGGAGAAAAA TGGGTCATGT AAATGTAGTA 
GGGAACAATC TTGAAGAAGT TAAGCAAAAA ATTGATAAAA TTATGCAACT AATCTATACT 
AATGGGTTAG ATTTATGA

Protein sequence

MFSVLDWKPK IGILGGGQLG WMIVLEGRKY PFTFYVLEND KNAPACRIAD RCFSPQDYKE 
FVDSSDVITF EFEHVYEKAL EYAEYSGKLL PRLNSVELKR ERYKEKLFYR QHNLPTPRFY 
VAEDGEEALK ILREEFNNVG VIKESKGGYD GKGQYFIFND VEKYQFLREK KEKMVVEEYV 
KFDFEASIII ARDKRGVFIS YPPTYNYNEK GILVYNYGPY NNQNIVEIAR RLSEELDYVG 
IMGVEVFVVN GKVLINEFAP RVHNTGHYTL DGALISQFEQ HLRAIIGMEL GPSTILSPSG 
MVNILGTDKI PVEVLKYGKV YWYSKSEVRK RRKMGHVNVV GNNLEEVKQK IDKIMQLIYT 
NGLDL