Gene Ssol_1561 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1561
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1418896
End bp	1420098
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	43%
IMG OID
Product	transposase, IS605 OrfB family
Protein accession	ACX91788
Protein GI	261602185
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.786289
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAGCC TTGTGTTTAA ATACTTCTTT GCCAAAATTT CCTTGATGGC TAGGAGGGTT 
AAAGCGATCA GAGCTACAGT TTCGATGAAG ATCGCAGTCT CAGACTCTCT CCTAGCCCTC 
GTTAATAACT ACGTTAAGGC ACTCCGTTTC ACCCTATTTT GGTTGAAAGA AAATGTCCCG 
AATCCTAATG AAAAGGGAGT GATTTCGAAA GTCCACGAGG AGTTGTACGA GAAGTTAAGG 
GAGGAGTACA ATCTACCATC AAAGGTTGCT GAGGATTGCT ATAGGGAAGC TCTCGCGACG 
TACAAGGGTT GGTATAATAA TCCTAAGAAG GGTAGGTTTC CGAGAGTGTA CAAACCTACG 
GTGTGGTTAA CGCCAAAAGC GAGTTATAAT GTGGACTTCG ACAAGATGAT TGTTAGGATT 
GCAAGTGTTG GTGAACTTCC AATCTTGGGA TATCCTAGAA ACCTCGAGGA GTACACGAGT 
TGGAGGATGA GGGAGGCTAG GTTAGTGATC AAAGATGGGA AGGCTTTTCT AAAAGTTGTT 
TTTGAGAAAG AGGAGGAGAA GGTTGAGCCA AAGGAAAGTG TTGCCGTAGA TATAAACATG 
GCTGAGATAG TTGTAGGGAA GGACGACGAG CACTACGTTA GGATCCCAAC TCGCCTTGAT 
GAGATTCACC AATGGAAGTC ATTAGCTGAG AATCTACAAA AGAAGTATCC AAGGAGGTGG 
AGGGAGAATA AGAGGATCTT GTATAGAGTC CGTTCTTTCC ATCTAAAGGC TAAGAGAATT 
ATGGAGGATT ATGCTAGGAA GGTTGGGAAG TGGGTTGTTG AAATCGCTGA AGATTTCGGT 
GCCAATGTTA TTAAGTTGGA GAGTCTTAAG AATCTTGTCA AGAATGTTGA TAAATTGCCT 
AAGGAGTTTA GGGATAAGTT GTATCTGATG CAGTATCGTA GGATTCAGTA TTGGATTGAG 
TGGCAAGCTA AGAAGCACGG TATTCTAGTT CAGTATGTTA ATCCCAGTTA TTCTTCCGTC 
TCATGCCCTA AGTGTGGTAA AAGGATGGAA GAAAAAGGAT ATCGTTGGTT TAGGTGCAAT 
TGCGGTTATG AAAATGATCG TGACGTTATT GCAATAGTTA ATTTAAACAG GAGGGGGTCT 
CTGACCCTCT CGACTGCCCA CCAAATGAGA GATGTAAGCC CGAATCGATG GTGGGAACGA 
TGA

Protein sequence

MDSLVFKYFF AKISLMARRV KAIRATVSMK IAVSDSLLAL VNNYVKALRF TLFWLKENVP 
NPNEKGVISK VHEELYEKLR EEYNLPSKVA EDCYREALAT YKGWYNNPKK GRFPRVYKPT 
VWLTPKASYN VDFDKMIVRI ASVGELPILG YPRNLEEYTS WRMREARLVI KDGKAFLKVV 
FEKEEEKVEP KESVAVDINM AEIVVGKDDE HYVRIPTRLD EIHQWKSLAE NLQKKYPRRW 
RENKRILYRV RSFHLKAKRI MEDYARKVGK WVVEIAEDFG ANVIKLESLK NLVKNVDKLP 
KEFRDKLYLM QYRRIQYWIE WQAKKHGILV QYVNPSYSSV SCPKCGKRME EKGYRWFRCN 
CGYENDRDVI AIVNLNRRGS LTLSTAHQMR DVSPNRWWER