Gene Ssol_2591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2591
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	2377318
End bp	2378445
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	49%
IMG OID
Product	transposase IS4 family protein
Protein accession	ACX92700
Protein GI	261603097
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATACA GACAAAATCG AGAGGATGAG AATTTCTGTA GAAAAGTTTG TATATACGAG 
GGCGAACTTG AACATATGAA GCATGAGAAT ACAACTAAAC CGGCGAAGTT CAACCGGGAC 
TTCGCCAGGT CCGCCCTCAA GATAATTTAC TCGATCCTCA CTAAAATACT TTTCCCTGAG 
GAACTCCTCA GTGCCTTGCT TAAGGCGAGT GGGAGCTACC TAAGCAGGTT GGGAAAAGAT 
GGGAGAAGAG CGTTGAGAAA GTTGAACGCG GTTCAAGTTG AGGACGTGAG GGATGCGTTG 
AAGAAAATGG GAAGGATGAC GTTAAGGGGA GTCAGGAACA GGAGGGTAGC AGTGGACTTC 
CATGCCATAC CTCAATACCA CGCTGACAAG AGTTTCTTGA GTAGGATAAA GCCAACTAAG 
GGGACGTCGT GGGGACTGGT TCAAGCTGCG ATCTTCCTCC TGGGGAGGAC GAGGAGCTTC 
TTGGACGTGA TCCCAGTGAC CGTGAAGAAC GTAGCTGAAG GTTTCAAGGC GGTGATGGAG 
GTAATCGTGA AGGAGTTGGA GGAGGACAAG CTGAGGCTCG TCATGGTCTT CGCGGACAGG 
GAGTTCGCGG TGAACGAAGT GATTAGATAC CTCTTGGAGT TGGGCTTGGA CTTCGTCATA 
TCTGCCAAGG CCCAGATGTA CAAGAAGTAC AAGGGGATGT TGCAAGATGT GGATGTGAGT 
TTTGGCGGAG TTAGATATAC TGGATTTCTC TGCGTGAGAC ATGGGAGCGG AGCTTATCTC 
ATTATCCTGA GGAAGGAAGA CGACAAGATT ATTGCCTTCC TCGTGAGGAG GGAGATGGAT 
CTTTATGATG CCATAGTCCT TGCCGAGATG TATAGGGAGA GGTGGGGGAT TGAGAATGTT 
TTTCGCTCTC TTGAGGAGTT CAGGATCAGG ACTAGGACTT GTGACGTGAG GAAGGAACTG 
GTTCTCGTTC TGCTTTCCTA TCTTCTCTTG AATGTCTGGT TCCTGATCCG TTCTTGGAGG 
AAGGTAAAGT TGTGGGAGTT CTCGGTCTCC CTCTCGAATC TCCTCGATCG GGAGGTAAGA 
GTGGAACAAG AACGCGCGTT CCGTGAAGTG AAGACGTCAT TCCCCTAG

Protein sequence

MKYRQNREDE NFCRKVCIYE GELEHMKHEN TTKPAKFNRD FARSALKIIY SILTKILFPE 
ELLSALLKAS GSYLSRLGKD GRRALRKLNA VQVEDVRDAL KKMGRMTLRG VRNRRVAVDF 
HAIPQYHADK SFLSRIKPTK GTSWGLVQAA IFLLGRTRSF LDVIPVTVKN VAEGFKAVME 
VIVKELEEDK LRLVMVFADR EFAVNEVIRY LLELGLDFVI SAKAQMYKKY KGMLQDVDVS 
FGGVRYTGFL CVRHGSGAYL IILRKEDDKI IAFLVRREMD LYDAIVLAEM YRERWGIENV 
FRSLEEFRIR TRTCDVRKEL VLVLLSYLLL NVWFLIRSWR KVKLWEFSVS LSNLLDREVR 
VEQERAFREV KTSFP