Gene Ssol_2454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2454
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	2259106
End bp	2260293
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	42%
IMG OID
Product	transposase, IS605 OrfB family
Protein accession	ACX92603
Protein GI	261603000
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.1066
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCACCT TAGGGTTTCG CTTCCGTGCT TACGCTGACG AACAAACCCT TAGGGCGTTA 
AAAGCCCAGT TGAAGTTAGC GTGCAAAATC TACAACACCT TAAGGTGGGC AGACATCTAC 
TTTTACCAAA GGGATGGGAA AGGACTAACA CAAACTGAGT TAAGACAGTT GGCTCTAGAT 
CTGAGAAAAC AAGATGATGA GTATAAGAAA CTCTACTCCC AAGTAGTTCA ACAAATAGCT 
GACCGTTATT ACGAAGCTAG ACAGAGGTTT TTCGACGGTT TAGCACGTTT CCCGAAAGAA 
AGGAAACCTC ACAAGTACTA CTCCCTTGTC TATACGCAAA GCGGTTGGAA AATACTTCAA 
GTTAGAGAAA TAAGAAAAGG AAGCAAGAAG AAACTAATAA CGCTTAAACT ATCAAATCTT 
GGTACGTTCA AGGTAATAGT TCACCGAGAC TTTCCCCTTG ACAAAGTAAA GAGAGTGATA 
GTGAAGCTAA CAAGATCTGA GAGGATTTAC ATCACTTTCG TAGTTGATCA CGAATTCCCC 
AAGTTACCTA ACACTGGTAA GGTAGTGGCG ATAGATGTTG GTGTAGAAAA GTTGTTAGTA 
ACGTCAGATG GTGAGTATTT TCCTAATTTG AGACCTTACG AGAAAGCGTT ATGGAAAGTG 
AAGCATCTAC ACAGAGAACT TTCAAGGAAG AAGTTCCTCT CTAATAATTG GTTTAAGGCT 
AAGGTTAAGC TTGCTAGGGC TTATGAGTAT TTGAAGAATC TAAGAACGGA TCTTTACATG 
AAGTTGGGTA AATGGTTTGC TGAGCATTAC GACGTTGTAG TCATGGAGGA CATTCATGTT 
AAGCAGTTGA TAGGTAAGTC ATTAAGGTCT CTGAGGAGGA GATTGAGTGA CGTCGCGTTC 
AGCGAGCTTA GAGATTTGAT TAAGTATCAG TTGGAGAAAT ACGGTAAGAA ACTCATCCTA 
GTTAATCCTG CATACACTTC CAAAACTTGT GCTAAGTGCG GGTACGTAAA AGAAGATCTG 
TCTCTATCTG ATCGTGTTTT CGTTTGTCCC AACTGTGGTT GGATTGCAGA TCGTGACTAT 
AATGCTTCTC TTAACATCTT ACGTGGATCG GGGTCGGAGC GACCCTTAGT GTGGAGCTCC 
GCCCTCTACC AGTACCAGCA CTTCGGTACT GGCATGGCAG AGCTGTGA

Protein sequence

MPTLGFRFRA YADEQTLRAL KAQLKLACKI YNTLRWADIY FYQRDGKGLT QTELRQLALD 
LRKQDDEYKK LYSQVVQQIA DRYYEARQRF FDGLARFPKE RKPHKYYSLV YTQSGWKILQ 
VREIRKGSKK KLITLKLSNL GTFKVIVHRD FPLDKVKRVI VKLTRSERIY ITFVVDHEFP 
KLPNTGKVVA IDVGVEKLLV TSDGEYFPNL RPYEKALWKV KHLHRELSRK KFLSNNWFKA 
KVKLARAYEY LKNLRTDLYM KLGKWFAEHY DVVVMEDIHV KQLIGKSLRS LRRRLSDVAF 
SELRDLIKYQ LEKYGKKLIL VNPAYTSKTC AKCGYVKEDL SLSDRVFVCP NCGWIADRDY 
NASLNILRGS GSERPLVWSS ALYQYQHFGT GMAEL