Gene Ssol_2444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2444
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	2247106
End bp	2248374
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	43%
IMG OID
Product	transposase, IS605 OrfB family
Protein accession	ACX92594
Protein GI	261602991
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTGAAGA ACTTAAGAAT TAGAAAATTT GAACCGGAAG AGGAATACGT ATATTTCACG 
TACTCCATCA AGAATAGTGA GAGGGAGAAG AGCAAAGAGT TAATTAAAGA ATACAGAACA 
CTACTACAGA AAGCAATTGA CTACCTGTGG AGCTTAACGA AAATACAAGT AAGAAAAAAG 
AACGGTAATT ACAAGATAAC ACTACCGAAG AAGAGGGAGG TGTACAAACC ACTTAGGGAC 
GAACTAGAGA AAATCAATCA CCTCGCGTCA CACTACGTCG ATAAGGCAAT TAATAACGCA 
TTCTCAATCA TCACATCATG GAGGAAAAGG GCCATAAAGG GGAGAGCTTC GATTGAAAAA 
CCTACGTTAA AGAAGGCTTA CGTTAAGGTT AAGTCTACAC TTAGGAAGGT TGTTGGGGAA 
AGCGTTAGGA TAACTGTAAG ACCTCATGAG TACATCACCT TCTCGTGGAG TAAGTCATGG 
TTCTCAAGAA GGGTTAGGGA GTTGGAACTT GGTGAACCTA TAATTAAGGA GGAGAAGGTT 
TACCTACCAT TTCGTTACAA GTTACCTTGG GCAACACCAG TGAACTTCCT GGCTATTGAC 
TCCAACCTTT ATACTCTAGA TGCTTATGAT GGTGAGAAAT TCGTTACAAT CTCTCTAAAG 
CAGTTGTACT CCCTTAAGTA CTCCATGGAG GTGAAGAGGG CTAAGGTGCA ATCATTTGCA 
TCTAAGCACA CGAAGAGGGG GAGAGAGTTG TTAAGGAAGT ATTCGCATAG GGAGAGGAAT 
CGCGTTCTGG ACTTCGTTCA CAAGTTTGTT AACACTTTGT TGGACTTGTA CCCCGTGACG 
TTTTTCGCTG TGGAAAAGCT TGATAAAGAG AGTATGTTTA AGGATGCTAA TGACTCTCTT 
TCGAGGAAGA TTTCTAGGAC TGTTTGGGGG AGTATACATA AAGTGTTGGA GTATAAGGCT 
CCGCTTTACG GTTCTTTCGT TAAGGAAGTG AACCCGTACC TCACCTCGAG GTCTTGCCCC 
AGATGTGGGT TTGTATCCCG AAAGGTTGGT AAGACCTTTG AGTGTGAGAG GTGCGGGTTC 
AAGTTGGATA GGCAATTGAA TGCTTCACTG AATATTTATC TCAAGATGTG CGGATTCCCT 
CACATCCGTG ACGTTCCACG GGTGTGGGTT GGGGTTATTC CGCTAATGGG GCGGAGAGGG 
ATGAACGTCC GTGACTTTGG TGAAGCCCAA GGGCTGAGGA TTGATATTAA ATATCATGAA 
ATCCTATGA

Protein sequence

MLKNLRIRKF EPEEEYVYFT YSIKNSEREK SKELIKEYRT LLQKAIDYLW SLTKIQVRKK 
NGNYKITLPK KREVYKPLRD ELEKINHLAS HYVDKAINNA FSIITSWRKR AIKGRASIEK 
PTLKKAYVKV KSTLRKVVGE SVRITVRPHE YITFSWSKSW FSRRVRELEL GEPIIKEEKV 
YLPFRYKLPW ATPVNFLAID SNLYTLDAYD GEKFVTISLK QLYSLKYSME VKRAKVQSFA 
SKHTKRGREL LRKYSHRERN RVLDFVHKFV NTLLDLYPVT FFAVEKLDKE SMFKDANDSL 
SRKISRTVWG SIHKVLEYKA PLYGSFVKEV NPYLTSRSCP RCGFVSRKVG KTFECERCGF 
KLDRQLNASL NIYLKMCGFP HIRDVPRVWV GVIPLMGRRG MNVRDFGEAQ GLRIDIKYHE 
IL