Gene Ssol_1800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1800
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1603076
End bp	1604281
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	35%
IMG OID
Product	GTPase of unknown function
Protein accession	ACX92016
Protein GI	261602413
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.016533
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTACCA TTGGAATTAT AGGAAAGACC AATGTGGGTA AAAGTACGTT TTTTGCAGCA 
GCAACGCTAA AAGATGTGGA AATAGCTAAT AGACCATTTG TAACTATAAA TCCAAATGAA 
GGCATAGGAT ATGTAAAAGT AAAATGCGCT CATACTGAAT TCAATGTGAA GTGTAATCCA 
AAAAATTCTA TATGTATTGA AGATTACAGA TTCATACCAG TAAAACTAGT AGATGTAGCT 
GGATTAATAC CTGGCGCTCA TGAAGGAAGA GGATTAGGAA ATAAATTCTT GGATGATTTA 
CGTCAAGCTG ATGCACTAAT ACACGTAATC GACGCAAGTG GGTCCACAAA TGAAGAGGGC 
GTCCCAGTAG AGCCCGGATC TAGAGACCCT GAAGAGGATA TAAAATTTAT AGAAAGTGAG 
CTAGATGAAT GGTTTTATTC AATTATTAAT AAAGATTGGG CTAAATTTGC CAGAACATCA 
GATTTATCTG GAAAAGATCT AGTAGACGCG TTATTAAGCA AACTATCCGG AGTATCTGTA 
AATAGATCAC ACATTATTGA GACTTTAAAA GTTACAAAAT TGGAAAACCT AAAATTAATG 
CAGTGGACGG AACAAGATCT AAGAGTATTT GCTAAAACTT TACGATCAGT AAGTAAACCT 
ATGATAATTG CTGCGAACAA GAGCGATCTA CCGCAAGCTA GAAATAACAT TAGGAGATTA 
AAAGAGAAAT ACAAGTGGGC TATTCCAACT AGTGCAGCAT CAGAAATGGC TCTACGGAAA 
GCCGCAAAAG CTGGAATAAT ATCTTACATT CCCGGAGATA GTGATTTTAC CATACTTAAA 
CCATTAAACG AGAAACAAAA GAGCGCTCTA GAATATATTA GAACTAGTGT ACTACAAGTA 
TATGGAAGCA CTGGAGTTCA GCAAGCAATA AATACAGCAA TCTTTGATGC GTTAAACATG 
ATTGTAACAT ATCCAGTTGA AGATGAGAGA AAACTAACTG ACAAAAATGG AAATGTTTTG 
CCAGACGCAA TACTCTTAAA GAAAGGGTCT ACTCCAAAAG ATTTAGCTAA TGCCATACAT 
ACGGAACTAG CTAAAGGTTT CTTATACGCT ATTGATGTGA AAAGAAAAAT GAGAGTGGGA 
GAGAATTATC AACTACAGAA TAATGATGTA ATAAAGATTG TTTCAAGTAC CGCTAGACCT 
TCTTAG

Protein sequence

MITIGIIGKT NVGKSTFFAA ATLKDVEIAN RPFVTINPNE GIGYVKVKCA HTEFNVKCNP 
KNSICIEDYR FIPVKLVDVA GLIPGAHEGR GLGNKFLDDL RQADALIHVI DASGSTNEEG 
VPVEPGSRDP EEDIKFIESE LDEWFYSIIN KDWAKFARTS DLSGKDLVDA LLSKLSGVSV 
NRSHIIETLK VTKLENLKLM QWTEQDLRVF AKTLRSVSKP MIIAANKSDL PQARNNIRRL 
KEKYKWAIPT SAASEMALRK AAKAGIISYI PGDSDFTILK PLNEKQKSAL EYIRTSVLQV 
YGSTGVQQAI NTAIFDALNM IVTYPVEDER KLTDKNGNVL PDAILLKKGS TPKDLANAIH 
TELAKGFLYA IDVKRKMRVG ENYQLQNNDV IKIVSSTARP S