Gene Ssol_1948 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1948
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1734199
End bp	1735368
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	37%
IMG OID
Product	DNA topoisomerase (ATP-hydrolyzing)
Protein accession	ACX92159
Protein GI	261602556
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.86374
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTCTG AATTTATATC AAAGGTTGAT AAAGAAGCGA GAAGGAAAGC TGCTAGTATA 
TTGCGCGATA AGTTCCTTAA TTTAGTTGAA CAACTTAAGA AAGGCGAACC ATTAGTAATG 
GAAATCCCAA TGAGAACTTT ATCTAATGCG ATCTATGATG AAAAGAGAAA GCTACTACTC 
TTGGGAGAAA AGAAACTTAA AAGGAATTTT CTAGATATGA ACGAAGCAAA ACGATTTATG 
CAGACCGTAT TGATGGCATC AATAATTTAT GACGCGCTAG TTAGCGATGA GTACCCAACT 
ATACGTGATC TTTACTACAG AGGAAAGCAC TCACTTTTGT TAAAGTCAAT TGATGGCAAT 
AAGATAGTGT CTGAAGAGAA TACATGGGAT GAACAAAAGG AGTCAGATAG TGTTATAGTT 
GATATCGAAG TATTTACGTC TCTCCTTAGA GAAGAAATGC TGATTCTCAG TAAGGAAAAG 
GGTAAAGTAG TAGGTAATTT AAGGATAAGG AGCGGAAATG ATACAATAGA TCTGAGTAAA 
ACTGGTCATG GAGCCTACGC GATTGAACCT ACTCCCGATT TGATAGATTT CATTGATGTT 
GATGCAGAAT TTGTACTAGT AGTGGAGAAA GATGCAGTAT TCCAACAGTT GCATAGAGCT 
GGTTTTTGGA AACAGTATAA GTCCATTTTA ATAACTAGTG CGGGTCAACC AGATAGGGCA 
ACTAGGAGAT TTGTCAGAAG ACTTAATGAG GAGCTAAAAT TGCCAGTTTA TATCTTAACT 
GATGCTGATC CCTATGGATG GTATATATTC AGCGTATTCA GAATAGGCTC AATATCTTTA 
TCTTACGAGA GTGAGAGGCT AGCTACTCCA GACGCCAAAT TTTTGGGCGT ATCAATGAGT 
GATATCTTCG GTAATTCCAG AAAGAAACCC TATTTAAGTG AAGCCGAGAG AAAGAATTAT 
ATAATTAAGG CCAAAGAGGC AGATATAAAG AGAGCTGAGG AAATTAAAAA CTATGAGTGG 
TTTAAGACTA AAGCATGGGA AGAAGAGATA AACACTTTCC TACATAGGAA AGCTAAATTG 
GAAATAGAAG CTATGGCAAG CAAGGGTCTT AAGTTTCTCG CTTTCCAGTA CATTCCAGAG 
AAGATAACTA ATAAGGATTA CATTGCCTAA

Protein sequence

MSSEFISKVD KEARRKAASI LRDKFLNLVE QLKKGEPLVM EIPMRTLSNA IYDEKRKLLL 
LGEKKLKRNF LDMNEAKRFM QTVLMASIIY DALVSDEYPT IRDLYYRGKH SLLLKSIDGN 
KIVSEENTWD EQKESDSVIV DIEVFTSLLR EEMLILSKEK GKVVGNLRIR SGNDTIDLSK 
TGHGAYAIEP TPDLIDFIDV DAEFVLVVEK DAVFQQLHRA GFWKQYKSIL ITSAGQPDRA 
TRRFVRRLNE ELKLPVYILT DADPYGWYIF SVFRIGSISL SYESERLATP DAKFLGVSMS 
DIFGNSRKKP YLSEAERKNY IIKAKEADIK RAEEIKNYEW FKTKAWEEEI NTFLHRKAKL 
EIEAMASKGL KFLAFQYIPE KITNKDYIA