Gene Ssol_2156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2156
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1939963
End bp	1941144
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	42%
IMG OID
Product	transposase, IS605 OrfB family
Protein accession	ACX92356
Protein GI	261602753
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCACCT TAGGGTTTCG CTTCCGTGCA TACACTGACG AACAAACCCT TAGGGCGTTA 
AAAGCCCAGT TGAAGTTAAC ATGTGAAATC TACAACACCT TAAGGTGGGC AGACATATAC 
TTTTACCAAA GGGATGGGAA AGGACTTACG CAGACTGAGT TAAGACAGTT GGCTCTAGAT 
CTGAGAAAAC AAGATGATGA GTATAAGCAA CTCTACTCGC AAGTGGTTCA ACAAGTAGCT 
GACCGTTATT CCGAAGCTAA GAAGAGGTTT TTTGAAGGTT TAGCACGTTT CCCAAAAGAA 
AAGAAACCTC ATAAATACTA CTCCCTTGTC TATACGCAAA GCGGTTGGAA AATACTTCAC 
GTTAGAGAAA TAAGAAAAGG CAAGAAGAAT AAGAAGAAAC TAATAACGCT TAAACTATCA 
AATCTTGGTA CGTTCAAGGT AATAGTTCAC CGAGACTTTC CCCTTGACAA AGTAAAGAGG 
GTAGTAGTGA AGCTAACAAG ATCTGAGAGG ATTTACATCA CTTTCGTAGT TGATCACGAA 
TTCCCCAAGT TACCTAACAC GGGTAAGGTA GTGGCGATAG ATGTTGGTGT AGAAAAGTTG 
TTAATAACGT CGGATGGTGA GTATTTTCCT AATTTGAGAC CTTACGAGAA AGCGTTATGG 
AAAGTGAAGC ATATACACAG AGAACTTTCA AGGAAGAAGT TCCTCTCTAA TAATTGGTTT 
AAGGCTAAGG TTAAGCTTGC TAGGGCTTAT GAGCATTTGA AGAATCTAAG AACGGATCTT 
TACATGAAGT TGGGCAAGTG GTTTGCTGAG CATTATGACG TTGTGGTGAT GGAAGGTATT 
CACGCTAAAC AGCTTGTGGG TAAGTCCTTG AGGTCTCTGA GGAGGAGATT GAGTGATGTG 
GGATTTGGTG AGTTGAGGGG TGTGCTGAAG TATCAGCTGG AAAAATACGG TAAGAAACTC 
ATCCTAGTTA ATCCTGCATA CACTTCCAAA ACTTGTGCTA GGTGCGGGTA TGTGAAAAAT 
GACTTGTCTC TATCTGATCG TGTTTTCGTT TGTCCCAACT GTGGTTGGAT TGCAGATCGT 
GACTATAATG CTTCTCTTAA CATCTTACGT GGATCGGGGT CGGAGCGACC CTTAGTGTGG 
AGCTCCGCCC TCTACCAGTA CTCTGGCAAG GTGGGGCTGT GA

Protein sequence

MPTLGFRFRA YTDEQTLRAL KAQLKLTCEI YNTLRWADIY FYQRDGKGLT QTELRQLALD 
LRKQDDEYKQ LYSQVVQQVA DRYSEAKKRF FEGLARFPKE KKPHKYYSLV YTQSGWKILH 
VREIRKGKKN KKKLITLKLS NLGTFKVIVH RDFPLDKVKR VVVKLTRSER IYITFVVDHE 
FPKLPNTGKV VAIDVGVEKL LITSDGEYFP NLRPYEKALW KVKHIHRELS RKKFLSNNWF 
KAKVKLARAY EHLKNLRTDL YMKLGKWFAE HYDVVVMEGI HAKQLVGKSL RSLRRRLSDV 
GFGELRGVLK YQLEKYGKKL ILVNPAYTSK TCARCGYVKN DLSLSDRVFV CPNCGWIADR 
DYNASLNILR GSGSERPLVW SSALYQYSGK VGL