Gene Ssol_2273 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2273
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	2066130
End bp	2067224
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	48%
IMG OID
Product	transposase IS4 family protein
Protein accession	ACX92454
Protein GI	261602851
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGGAAGC CGGTATTATC ACGTGGTGAA GACAAGGTGA TAACACCTGG TCTTCCCCAC 
CAAAATAATA TACAACAAGT AGGGTATAAA TTACTTTCCA TGTTGAGCTT CAAGGGAAGA 
AAGGCTGAGG AGGTATCGAG AGTTCTGGTC TCCGCGTGCT TGTGGAACGA CTCCGTGGAA 
AGCAAGTCCA AAGGGTATAA CGTGTCACCA CAGACCGTGA GGAACTACGT GGAGGAGCAG 
GGAACTGAGG TGATCGAGAA GCTATTAGAG TCCATGAGGA GGATTTCCAT GGAGATACTC 
AAGGGAGTGA AGGAAGTCGA CATCTCCATA GACTGGACAA CCAAGACGTG GTATGGTAAG 
CCGGTGGAGG GACTGGGTAG TTCAGCCAAG GGGAACTCGT GGAACTACGC TACCGCGACC 
ACGAAGTATC AGAATATGGT GCTCCTCCTA GCTTTCGTTC CCCAAGTTAA CGGGATGAGC 
AAGGATGAGA TCGTGAAGCT TCTCATGGAG CAAATTGTGG GAATGGGCCT CAAGGTGGGG 
CTCGTAACCT TGGACGCGGG ATTCTACACC GTGGAAGTCC TCAAGTTCAT ATCGCAGTTC 
AAGTTCGTGA TAGGAGTCCC TGTGGGGGAC GTGAAGATCT ACGAGGAGTT CGACGGAGAG 
TACACGACAA ACAGTAAGAG GTATAAGAAG GAAGAGCAGG TCAAGTTCAG ACTCCTGGTG 
TATGGTAAGG AAATCGTTAA GAAGAGGAAG AAGACCGTGG TGTACTTCGC GAGGGCGACC 
AACCTCGACC TACCCAAGAG GGAAGTGCTG AAGTTGTACA ACAAGGTTAG GAGTCCCATT 
GAGACGTCTT ACAGGAACAT CAAGGCCTTC CTTCCCTTCA CGAGCTCCAC CAAGTTCATC 
TTCCGCGAGT TGATCTTCGT GCTGGCCATG ATCTTCTACT CGCTTTACAC CGTGTTTAAG 
AACGTCATGA CAAGAGAGGA GTTTAGATTG CTGCTCATCC TCTGCTTTCT AGACGATTTA 
TCTGATCTAA AGGATTTTAT ATTTAATCTT GAGGAAACAC TTATTAATAC TATAGATTTA 
TTTTTATGGA GGTGA

Protein sequence

MRKPVLSRGE DKVITPGLPH QNNIQQVGYK LLSMLSFKGR KAEEVSRVLV SACLWNDSVE 
SKSKGYNVSP QTVRNYVEEQ GTEVIEKLLE SMRRISMEIL KGVKEVDISI DWTTKTWYGK 
PVEGLGSSAK GNSWNYATAT TKYQNMVLLL AFVPQVNGMS KDEIVKLLME QIVGMGLKVG 
LVTLDAGFYT VEVLKFISQF KFVIGVPVGD VKIYEEFDGE YTTNSKRYKK EEQVKFRLLV 
YGKEIVKKRK KTVVYFARAT NLDLPKREVL KLYNKVRSPI ETSYRNIKAF LPFTSSTKFI 
FRELIFVLAM IFYSLYTVFK NVMTREEFRL LLILCFLDDL SDLKDFIFNL EETLINTIDL 
FLWR