Gene Ssol_1003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1003
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	944012
End bp	945871
Gene Length	1860 bp
Protein Length	619 aa
Translation table	11
GC content	31%
IMG OID
Product	conserved hypothetical protein
Protein accession	ACX91247
Protein GI	261601644
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.12634
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCATAATA ACTTTTACAG AATATTAAAG CCAACAAAAG TAGGCAATGT TGAGGTAAAG 
AACGTAATAA AATACTCAGA AGGTATATCT ATCTTACCAA ATGCCGTACC TAGATATGAA 
TACTTTAGGG GATTAGAGGG TGAGAATGTA ATTGATTTCA TTGATTATAA GGGTGTAGAT 
GACTTAGGTG ACAAGCTACG AGTAAAGGCT GGTACTAAAT GGAGTGAAGT TCTGGAAAAA 
TATAAAGTAG AATTTTGGTC TAATGCGGAT TTTTCTATTG GAGGGTCTGT ATTCTTTAAT 
GACCCAATTA CAGGCTTTAA TGAATTTGGA AAGATAAATG GGAGAGTTGA AGTTGATGCC 
TACTTGGATG GCAAATATTA CTCTGGACGA TATAAGGGTG GAATTGTAAT ACATGTCTAT 
TTGAAAAAAG AGGAAAAGGA AATAGTGTAT AAAAGGTTAT ATGGAAACTT ATCCGAATTA 
ATTTCTATTA TAAAAAGTTG GTATACTTCA AGAATACCAG TATTTAGGGA AGTTAGTCTA 
GTAAAGAAAG ATAAGGAGAG TTATATACTG GTATCATATC CCAAAACAAG AGAAGTACTG 
CTACAGGGTT TATTAAGCGA GTTTAACGAA GAAAGTTCAC CTATTGTTGA GAAGATAGAG 
TATGAGTATT GGTATCTAGG TTACTCACCT CTAAACACAA TTGATAGTAT AATTAATCTT 
GCAAAAGAAT CTCAGCTGTC GGTAATACGA TTTAGAAAGG ATGAAATCGC TTATTCAATT 
TACTCTAATA AGCGACTAGA GTCTATAAGA AACACTCTAG AGTATTCTAC CATAGAGGGA 
GAAGGCTTAT TCAATGGATG CATTCTATGC GGTAAATGTG TTAGTGTTTG CCCTTACGGT 
AAACAAACTA ATGACGTATT CCATACTCCT CTTGGTTTCT ATTCAATCAC ATATTTTGAG 
AAAGAGAACG ATCTGGCTAA TTGTCACATG TGTGGTTTAT GTGAACAAGT TTGTCCTGTA 
AGATTAGATA TCACTAATGA ATTAAGAAAA GCTACAAAAA TTAATCAAAT ATCCCCTAAG 
AATCTACTCA GAAGTATTAA CAGCGATCTA AGTAGTGTTC TGATAATAAC ATCTTTATCA 
GAAGAACTTA ATGATCAAAT AATTAAGTCT CTTATATACT TAATTAAAAA AGGTAAGAGA 
GTAGGTATAT TTTACCTAGC AGAAGACTTT TCGAAAATAG TGAAGAATGA GTTTAGTTTA 
GAGGGATTGT TAAAATTTAA AGAAATTTAT ACCATAACAC CTGAAGAATA TTTCTATTTA 
CAGAAACTAA AGAAAAGGAC TGTAATAGAT ATATACAATA TACAATTATT AGCAATGAAC 
GACTTAAAAA TGAATAAAGA TAACCTTCAT ATACCATGCT TGTTAGGGAG TGAGTTAAAC 
GAGTCAAATT TTACTTGCAC CAATGTGTTT CTTAATATCC TTAATAATAA GGATAATATT 
AATAGGACAA TTGATAAAAA AGTTACACTA TGCCCATTAA CTGCAAGGGA ATTAAATATT 
AAAACACCGT TAGATTTAGT TGAAATAAAC TTAGATGAAA ATTATATTAG CGATTTTTAC 
AAAAAGCTTG AGATCGGTAC TAAAGATTTA GGAGAAGATA TTGAGGAAGA TTTAGGTTGG 
TACAAGGATA TTGAGGATAG AATAGTAGAT GAAGTATACT CTACACTAAT AGATGGAATA 
ATTAAAGGCG AGAACATAGA GAACTTAGTT CTACTGTATT TCAAACTAAA TAGTATGGAC 
TTAACCAAAA ATATTAAAGA GATCTTAATG GATAAGTTAA CTAAAATTAT TTTCTCCTAA

Protein sequence

MHNNFYRILK PTKVGNVEVK NVIKYSEGIS ILPNAVPRYE YFRGLEGENV IDFIDYKGVD 
DLGDKLRVKA GTKWSEVLEK YKVEFWSNAD FSIGGSVFFN DPITGFNEFG KINGRVEVDA 
YLDGKYYSGR YKGGIVIHVY LKKEEKEIVY KRLYGNLSEL ISIIKSWYTS RIPVFREVSL 
VKKDKESYIL VSYPKTREVL LQGLLSEFNE ESSPIVEKIE YEYWYLGYSP LNTIDSIINL 
AKESQLSVIR FRKDEIAYSI YSNKRLESIR NTLEYSTIEG EGLFNGCILC GKCVSVCPYG 
KQTNDVFHTP LGFYSITYFE KENDLANCHM CGLCEQVCPV RLDITNELRK ATKINQISPK 
NLLRSINSDL SSVLIITSLS EELNDQIIKS LIYLIKKGKR VGIFYLAEDF SKIVKNEFSL 
EGLLKFKEIY TITPEEYFYL QKLKKRTVID IYNIQLLAMN DLKMNKDNLH IPCLLGSELN 
ESNFTCTNVF LNILNNKDNI NRTIDKKVTL CPLTARELNI KTPLDLVEIN LDENYISDFY 
KKLEIGTKDL GEDIEEDLGW YKDIEDRIVD EVYSTLIDGI IKGENIENLV LLYFKLNSMD 
LTKNIKEILM DKLTKIIFS