Gene Ssol_2771 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2771
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	2535348
End bp	2536568
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	44%
IMG OID
Product	transposase, IS605 OrfB family
Protein accession	ACX92854
Protein GI	261603251
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.680266
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGTTAA GGGTTAAGGT TGATTATTCT ACATACTCAG CACTTAAGGA GGTCGAGAAG 
GAGTACAGAG AGGTTCTAGA GGACGCAATA AATTATGGGC TGTCAAACAA AACTACCTCC 
TTCACCAGGA TTAAAGCTGG AGTTTACAAG ACTGAGAGGG AGAAACATAA GGACTTACCC 
TCCCATTATA TTTACACAGC TTGTGAGGAT GCAAGCGAGA GATTAGACAG TTTTGAGAAG 
TTAAAGAAGA GAGGTAGGAG TTACACTGAG AAACCGTCAG TGAGGAGAGT TACTATTCAC 
CTCGACGATC ATCTGTGGAA GTTCAACCTC GACACGATTT CAATTTCCAC AAAGAGGAGT 
AGGATTCTCA TTTCACCAAC CTTCCCTAAG ATCTTCTGGA GATATTATAA CACGGAGTGG 
AGGATTGCGA GTGAGGCCAG GTTTAGGCTG ATGAAGGGGA ATGTTGTAGA GTTCTACGTC 
ATTTTTAAGA GAGATGAGCC TAAACCTTAT GAACCTAAAG CGTTTATTCC CGTCGACCTT 
AACGAGAATT CGGTCTCGGT GCTCATCAAC AGTAAACCCT TATTGCTTGA GACTAACACT 
AAGAAAATTA CTCTGGGCTA TGAGTATAGG AGGAAGGCAA TAACTACTGG TAAGTCAACT 
AAGGATAGGG AAGTGAGGAG GAAGTTAAAG AGGCTGAGGG AGAGGAATAA GAAAGTAGAC 
ATTAGGAGGA AATTAGCTAA GCTAATCGTT AAAGAGGCTT TTGAAAGTAG GAGTGCAATT 
GTCTTGGAGG ACTTGCCAAG GAGAACTCCG GAGCATATGA TAAAGGACGT GAAGGATAAA 
CAGCTTAGGT TGAGGATTTA TAGATCTGCA TTTTCCTCAA TGAAGAACGC TATTATTGAG 
AAGGCTAGGG AGTTTGGTGT CCCCGTGGTC TTAGTTAACC CATCTTATAC TTCCACTGTT 
TGCCCAATTC ATGGGGCGAA TATCGTTTAC CAACTCGATG GGGGCGATGC CCCAAGGGTT 
GGTGTTTGTG AGAAGGGGAA GGAAAAGTGG CATAGGGATG TAGTTGCACT GTACAACTTA 
GCGAGGAGAG CTGGAGATGT GAGCCCCGTG CCGTTGGGCT CGAAGGAGTC CCATGACCCA 
CCTACCTTAA GTGGGTGGTT GAGGGCTAAG TCCCTACACT CGATCATGAA TGAACATAAA 
ATGATTGAAA TGAAAGTGTA G

Protein sequence

MKLRVKVDYS TYSALKEVEK EYREVLEDAI NYGLSNKTTS FTRIKAGVYK TEREKHKDLP 
SHYIYTACED ASERLDSFEK LKKRGRSYTE KPSVRRVTIH LDDHLWKFNL DTISISTKRS 
RILISPTFPK IFWRYYNTEW RIASEARFRL MKGNVVEFYV IFKRDEPKPY EPKAFIPVDL 
NENSVSVLIN SKPLLLETNT KKITLGYEYR RKAITTGKST KDREVRRKLK RLRERNKKVD 
IRRKLAKLIV KEAFESRSAI VLEDLPRRTP EHMIKDVKDK QLRLRIYRSA FSSMKNAIIE 
KAREFGVPVV LVNPSYTSTV CPIHGANIVY QLDGGDAPRV GVCEKGKEKW HRDVVALYNL 
ARRAGDVSPV PLGSKESHDP PTLSGWLRAK SLHSIMNEHK MIEMKV