Gene Ssol_1177 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1177
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1095197
End bp	1097026
Gene Length	1830 bp
Protein Length	609 aa
Translation table	11
GC content	31%
IMG OID
Product	protein of unknown function DUF814
Protein accession	ACX91415
Protein GI	261601812
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTCTC AGAATATAAA ATTACAGAGA AAAAACAGTA TGACTTACTT TGATTTAATA 
GCGTGGATTA CAGAAAATAA GAAAGCGATA GAGGGATGTA TAATAGATAA CGTTTTCTTG 
ATACAAAATA CTCAAAATAC ATATATTTTA AAGTTACATT GCAGTGGAAG AGACCAAGAA 
TTAATAATAG AACCAAGTAA ACGAATAAAT ATAACAAAAT ACAATTATCC AAAAATTTCT 
TCAACAAAAA TAACCGAATT AAGAAGATTA ATTAGAGGAG ATATAATTAC GGATATGTAT 
GTATTGAACA AGGAAAGAAT ATTAATCCTA AAACTCAAAA GGGATGATAA AAAGGTAATA 
GTAGAACTAC TACCTAGAGG AGTTTTGGTA ATAGCAGATA AAGATGGTAA AATCTTGTTT 
GCGAGTGAAT ATAAAGAGTT TAAAGATAGA CTCATAAGAA TAGGGGAGAT ATATAAACCT 
CCACCTTCAA TTGAACCTAA TATAGATGAA ATAGAAAAAT TGATTAAGAA AGGAAACATA 
GCGAAAGGTT TAGGAATCCC ACAAGAAGTA GCAAACTATC TTAGCTTACA AGACTCTACA 
CCAGATATTA ACGTAATAAG GGAAAAGATA AGAAATTTAG AGATTTCAAT AATTAATGGA 
GAGATAAAAC CATGTCTCGT AGAAGATACA ACTGTAGTAC CTTTTTATCT TGACGGATGC 
AAAGAATATC AAAGATTTAA TGATGCAATA GACGATTATT TCTACACTAT AACTCAAAAA 
GAGCTATCTG AAAAAACTTC CAAAAAAATC TCAGAAGAGA AGCAGAAGAT TATAGCCACA 
ATTAAGCAAA TAGAGGATAG TATAAAGGAT TATGAAGACA AAGAAAATAA CTATAGACAA 
CTAGGCAATT TTATACTTTC AAAGGCATAC GAAATAGACC AGTTGTTGTT AAATAATAGA 
GCAAAAAGTA AAAAGGTAAA GCTTAATGTA GATGGAGTTG AAATTGAATT AGATACCTCA 
CTCTCAGCTA CTAAAAACGC AATGAGATTT TTTGATGAAG CTAAGGAATA TAAGAGAAAA 
ATAGAAAGAG CCCTTAAAAG TTTAGAAGAA CTAAAAGAAA AACTGGCTAA AATAGAGAAA 
CAAGAAATAG AGAAACAAAA CGAGATAAAA CTAACGCTAA GGAAAAAGGA ATGGTATGAG 
AAATATAGAT GGAGTATTTC AAGAAGCGGA TATTTAATAA TTTTAGGAAG AGATGCAAGT 
CAAAATGAAA GTATAGTTAA AAAATACCTA AGGGACAAAG ATATATTCTT GCATGCGGAT 
ATTATAGGCG CTCCAGCCAC AATCATCATA ACACAAGATA ATAAGACAAT CTCTGAAGAA 
GATATCTATG ATGCAGCAGT TATGGCTGCG AGCTACTCAA AGGCTTGGAA AGTAGGTTTA 
GCATCTGTTG ACATATTTTG GGTTTTAGGC AATCAAGTCT CTAAATCACC GCCAAGTGGA 
GAATACTTGA ATAAAGGTTC ATTCATGATT TATGGAAAAA AGAATTTCAT AAAAAACGTC 
AAACTACAAT TAGCAATAGG CCTTATACTA AGTGAAAACG GTGTATCAGT AATAGTGGGA 
AGTGAGGAAA CCATTTCGGC TAAGACTAAA TACTATGTTG TCATAGCTCC AGGTGATGAT 
GATAAAGAGA GAATAACCCA AAAAATTATA AAAGTGTTTA GTAGAGCTTT ACCAGAAATA 
AACGGATTGA ACGCATTAAA AACAGAGATT GAAGATAAAA TTCCGGGAAA GAGCAAGATA 
GTTAAGACAA GTATAACATA TAATAGTTAA

Protein sequence

MSSQNIKLQR KNSMTYFDLI AWITENKKAI EGCIIDNVFL IQNTQNTYIL KLHCSGRDQE 
LIIEPSKRIN ITKYNYPKIS STKITELRRL IRGDIITDMY VLNKERILIL KLKRDDKKVI 
VELLPRGVLV IADKDGKILF ASEYKEFKDR LIRIGEIYKP PPSIEPNIDE IEKLIKKGNI 
AKGLGIPQEV ANYLSLQDST PDINVIREKI RNLEISIING EIKPCLVEDT TVVPFYLDGC 
KEYQRFNDAI DDYFYTITQK ELSEKTSKKI SEEKQKIIAT IKQIEDSIKD YEDKENNYRQ 
LGNFILSKAY EIDQLLLNNR AKSKKVKLNV DGVEIELDTS LSATKNAMRF FDEAKEYKRK 
IERALKSLEE LKEKLAKIEK QEIEKQNEIK LTLRKKEWYE KYRWSISRSG YLIILGRDAS 
QNESIVKKYL RDKDIFLHAD IIGAPATIII TQDNKTISEE DIYDAAVMAA SYSKAWKVGL 
ASVDIFWVLG NQVSKSPPSG EYLNKGSFMI YGKKNFIKNV KLQLAIGLIL SENGVSVIVG 
SEETISAKTK YYVVIAPGDD DKERITQKII KVFSRALPEI NGLNALKTEI EDKIPGKSKI 
VKTSITYNS