Gene Ssol_2067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2067
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1855469
End bp	1856743
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	33%
IMG OID
Product	protein of unknown function DUF402
Protein accession	ACX92273
Protein GI	261602670
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGGAA GAGTTAGAAT AAGGGGAATC TACGCTACAG CATTAACGTC AATTTTTTCC 
TCTCTTTCAT ACGAAATTGT ACAACAATCT GTGGAAATAT CAGAACGATT TATGCAAGAA 
ATTAATAACT TATCAGCTGA TATCACAATA AAGGATTTTG AGGATGATAG AGGCAAGATC 
ATCGTAATGG GAAATGGAAT TATAGAAGAT GACTTACGTA ACGTTTTTAA ATACTCATTC 
CATTGGAGAA GCCCAGTTAA ACTATACTCG GTAATAGAAA TAGACGAAAG TTGCACTTAC 
GCTAACTTTA AAGTAGAACC TTGCTTGAGA GAGGGAATCG TTATAAAACC ACCTTATGAC 
GGAAAAATAA TACTAAGTGA AACTAAGGCC GTAAGTAAAT ACGCTATTGT ATGGAGAGGG 
AAGGGAATAA CTACTTTTTC AGAGCACATC GTTGATGAGG AAGAAAAAAT GAGGCTATTA 
ACCTTGAGTT TACCTCTTAA TAGAAAAGGA TATAATGTAA AGTGGAGAAG TAATGCAAAG 
TATGTCGCAT TAAATGAATT GAAAGAGGAT CTAGAAAGGT TAATATTAAG GTATGAAAAT 
AGGGAGTTCA GAGATCAAGG AGAGGATTTT TATTTAATAA CTCTTTCATT ACCGGATAAA 
CTGTATTTAG ATGAGGTTAG AAAGAATGTA GTTGATACTG TTAAGTATCA TCATATGTTA 
AAGTTAAGCT ATAATAGGGA AGTTGATTCT TTGGAAAAGG ATAAGAAAGG TTCTCTCGGT 
AAATTATTGG AAGGGCTAAT CTCAGATTTC TTGAAAATTG AACACATTAA GGCTGATGGA 
AAGGTAATTT ATTTGAGAGG TGGAAAGGTA ATTGAAAAGG AAGTTAACGA TAACGGATAT 
AGAATAGTCC TTAGGCGTGA GTTTGAAGGT AACGGGATTC TAGATGGTAT AGGTAAGAAG 
ATAGAGGAGG GTGATTACGA TATTGTAGAA TATAATTCTG ATAAGTGGTA TCAGATACAT 
AAGTATTATA GTGGTATAGA TAACTCACTA AAGGGAGTCT ACATTAATAT ATCAACACCA 
CCGGAATTAC TTAGAGGAAA AATAAGGTAT TTGGATCTAG AAATAGATAT TGCAATTAGA 
GATTCAGAAA TAGCATTATT AGATGAAGAT GAACTAAATA AAAAGAGTAT TTACATGCCC 
TCTTCGCTAG TAAATAAAGC TAAGGAAGTT GTAAATTATC TAATAAATCG AATTCAACAA 
AATAAGTTGA GTTGA

Protein sequence

MKGRVRIRGI YATALTSIFS SLSYEIVQQS VEISERFMQE INNLSADITI KDFEDDRGKI 
IVMGNGIIED DLRNVFKYSF HWRSPVKLYS VIEIDESCTY ANFKVEPCLR EGIVIKPPYD 
GKIILSETKA VSKYAIVWRG KGITTFSEHI VDEEEKMRLL TLSLPLNRKG YNVKWRSNAK 
YVALNELKED LERLILRYEN REFRDQGEDF YLITLSLPDK LYLDEVRKNV VDTVKYHHML 
KLSYNREVDS LEKDKKGSLG KLLEGLISDF LKIEHIKADG KVIYLRGGKV IEKEVNDNGY 
RIVLRREFEG NGILDGIGKK IEEGDYDIVE YNSDKWYQIH KYYSGIDNSL KGVYINISTP 
PELLRGKIRY LDLEIDIAIR DSEIALLDED ELNKKSIYMP SSLVNKAKEV VNYLINRIQQ 
NKLS