Gene Ssol_1059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1059
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	989050
End bp	990258
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	35%
IMG OID
Product	TOPRIM domain protein
Protein accession	ACX91302
Protein GI	261601699
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0877165
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATATG ATATAAGGTT AAGATTTGAA GTAGAGGGTA TAGTCGAAAA AACTGATGTA 
ATAGGTGCAA TATTTGGCCA GACTGAAAAC TTATTTGGAG ATGAATTCGA CCTAAGAGAG 
TTGCAAGATA AGGGAAGATT GGGAAGGATT ATTGTAGAGG TAAAAACTAA AGGAGGGAAA 
AGCGAAGGAG AAATAATTAT ACCATCGAAC TTAGACAGAA TTGAGACCGC ATTAATTGCT 
GCAATGGTTG AAAGTGTAGA TAAGGTAGGA CCATACAATT CAAAATTTGA GCTTATAGAA 
ATAGAAGACA TTAGAGCTGA GAAACTTAAA AAAATCATAG AAAGAGCAAA GGGAATTTTG 
TCAAGCTGGA GTAAAGAGAA ATCACTGGAC ATAAAGGAAG TAATAAATGA GATAAGTAGC 
GCAGTAAAGG TAGGGGAAAT AACAGAATAT GGACCAGAAA GATTACCCGC AGGCCCAGAC 
GTGGACAAGG ATCCTAATTT AATAATAGTA GAAGGAAGAG CTGATGTAAT AAATCTACTC 
AGATATGGCT ACAAAAACGT AATAGCAGTA GAAGGAGCCA CGTCAAGGAT ACCGGAAACA 
CTAATTAACT TATCTAAGAT GAAGAAGACA GTAATAGCGT TTTTAGACGG AGACCACGGT 
GGAGATCTGA TACTCAAAGA ATTATTAAGT AATAATGTAA AGATAGATTT CGTAGCAAGA 
GCACCGATTG GCAGAGAGGT AGAAGAACTA ACAGGGAAAG AAATTGCAAA AGCCCTTTCC 
AATATGATGC CACTTACTCA ATATCTAAAG AAGGTTCAAG AGGCAGAACA AGCAATAGCT 
AAAAATGTTA TTGCAAAAGA AGAGAAACCA ATACAGTCTG AAACTACACA ACAAGTAGTC 
CAGATAACTT TGCCACAAAA TATCCTTGAA GAAATCAAGA AACTCCCTGG AACTCTAGAG 
GGCGTTCTCT ATGATAATAA TTGGAATTTG ATTGAGAAAG TTCAAGTACG AGATATAATA 
CCTAAGTTAG AGGCTTACGA AGACAATAAA GTAGCTTATA TAATATTTGA TGGGGTAATA 
ACTCAAAGAT TATTAGATTT AGCGTCTCAA AAAAACATTA AAATGATAAT AGGAGCTAGA 
ATAGGTGGAA TAAACAAAAG ACCGCAAAAC GTCGATATAT TGACATTTAC CGATATTATT 
TCTTCTTAG

Protein sequence

MKYDIRLRFE VEGIVEKTDV IGAIFGQTEN LFGDEFDLRE LQDKGRLGRI IVEVKTKGGK 
SEGEIIIPSN LDRIETALIA AMVESVDKVG PYNSKFELIE IEDIRAEKLK KIIERAKGIL 
SSWSKEKSLD IKEVINEISS AVKVGEITEY GPERLPAGPD VDKDPNLIIV EGRADVINLL 
RYGYKNVIAV EGATSRIPET LINLSKMKKT VIAFLDGDHG GDLILKELLS NNVKIDFVAR 
APIGREVEEL TGKEIAKALS NMMPLTQYLK KVQEAEQAIA KNVIAKEEKP IQSETTQQVV 
QITLPQNILE EIKKLPGTLE GVLYDNNWNL IEKVQVRDII PKLEAYEDNK VAYIIFDGVI 
TQRLLDLASQ KNIKMIIGAR IGGINKRPQN VDILTFTDII SS