Gene Ssol_1514 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1514
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1388811
End bp	1390025
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	43%
IMG OID
Product	transposase, IS605 OrfB family
Protein accession	ACX91742
Protein GI	261602139
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGTTAA GGGTTAAGGT TGATTATAAA ACTTACTCAG CACTTAAGGA GGTCGAGAAG 
GAGTACAGAG AGGTTCTAGA GGAGGCAATA AATTATGGGC TGTCAAACAA AACTACCTCC 
TTCACCAGGA TTAAAGCGGG AGTTTACAAG ACTGAGAGGG AGAAGCATAA GGACTTACCC 
TCCCATTATA TTTACACAGC TTGTGAGGAT GCAAGCGAGA GATTAGACAG TTTTGAGAAG 
TTGAAGAGGA GAGGGAGGAG TTACACTGAG AAACCGTCAG TGAGGAGAGT TACTATTCAC 
CTCGACGATC ATCTGTGGAA GTTCAACCTT GATAGGATTT CAATTTCCAC AAAGAGGAGT 
AGGATTCTCA TTTCACCAAC CTTCCCTAAG ATCTTCTGGA GATATTATAA CAAGGGCTGG 
AGGATTGCGA GTGAGGCCAG GTTTAAATTG TTGAAGGGGA ATGTTGTAGA GTTCTACGTC 
ATTTTTAAGA GAGATGAGCC TAAACCTTAT GAACCTAAGG GTTTCATCTC AGTTGATCTA 
AATGAGAATT CAGTCTCTGT ATTAGTTGAT GGAAAACCGA TGCTTTTAGA GACTAACACT 
AAGAGGATTA CTCTGGGCTA TGAGTATAGG AGGAAGGCAA TAACTACTGG TAAGTCAACT 
AAGGATAGGG AAGTGAGGAG GAAGTTAAAG AGGCTGAGGG AGAGGAATAA GAAAGTAGAC 
ATTAGGAGGA AATTAGCTAA GCTGATCGTT AAAGAGGCTT TTGAAAGTAG GAGTGTCATA 
GTTTTAGAGG ACTTGCCAAG GAGAACTCCG GAGCATATGA TAAAGGACGT GAAAGACTCT 
CAGCTTAGGT TGAGGATTTA TAGAGCAGCA TTTTCCTCAA TGAAGAATGC TATTATTGAG 
AAGGCTAGGG AGTTTGGTGT CCCCGTGGTC TTAGTTAATC CGTCTCACAC TTCCACTGTT 
TGCCCAGTTC ATGGAACTAA GATCGTTTAC CAACTCGATG GGGGCGATGC CCCAAGGGTT 
GGTGTTTGTG AGAAGGGGAA GGAAAAGTGG CATAGGGATG TAGTTGCACT GTACAACTTA 
GCGAGGAGAG CTGGAGATGT GAGCCCCGTG CCGTTGGGCT CGAAGGAGTC CCATGACCCA 
CCTAAAAGGT GGTTGAGGGC TAAGTCCCTA CACTCGATCA TGAATGATCA TAAAATGATT 
GAAATGAAAG TGTAG

Protein sequence

MKLRVKVDYK TYSALKEVEK EYREVLEEAI NYGLSNKTTS FTRIKAGVYK TEREKHKDLP 
SHYIYTACED ASERLDSFEK LKRRGRSYTE KPSVRRVTIH LDDHLWKFNL DRISISTKRS 
RILISPTFPK IFWRYYNKGW RIASEARFKL LKGNVVEFYV IFKRDEPKPY EPKGFISVDL 
NENSVSVLVD GKPMLLETNT KRITLGYEYR RKAITTGKST KDREVRRKLK RLRERNKKVD 
IRRKLAKLIV KEAFESRSVI VLEDLPRRTP EHMIKDVKDS QLRLRIYRAA FSSMKNAIIE 
KAREFGVPVV LVNPSHTSTV CPVHGTKIVY QLDGGDAPRV GVCEKGKEKW HRDVVALYNL 
ARRAGDVSPV PLGSKESHDP PKRWLRAKSL HSIMNDHKMI EMKV