Gene Ssol_2633 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2633
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	2414577
End bp	2415695
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	41%
IMG OID
Product	transposase, IS605 OrfB family
Protein accession	ACX92737
Protein GI	261603134
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.56671
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAGTTAG CGTGCAAAAT CTACAACACC TTAAGGTGGG CAGACATCTA TTTCTATCAG 
AGGGATGGGA AAGGACTAAC ACAAACTGAG TTAAGACAGT TGGCTCTAGA TCTGAGAAAA 
CAAGATGATG AGTATAAGCA ACTCTACTCG CAAGTAGTTC AACAAATAGC TGACCGTTAT 
TACGAAGCTA GACAGAGGTT TTTCGAAGGT CTAGCACGTT TCCCAAAAGA AAAGAAACCT 
CATAAATACT ACTCCCTTGT CTATCCCCAG TATGGTTGGA AAATACTTCA GGTTAGAGAA 
ATAAGAAAAG GAAGCAAGAA GAATAAGAAG AGACTAATAA CGCTTAAACT ATCAAATCTT 
GGTACGTTCA AGGTAATTAT ACACAGGGAC TTTCCCCTTG ACAAAGTAAA GAGGGTAGTA 
GTGAAGCTAA CAAGATCTGA GAGGATATAC ATCACTTTCG TAGTAGAAGA TTACGAATTC 
CCCAAGTTAC CTAACACTGG TAAGGTAGTG GCGATAGATG TTGGCATAGA GAAGCTGATC 
GTAACGTCAG ATGGTGAGTA TTTTCCTAAT TTGAGACCTT ACGAGAAAGC GTTATGGAAA 
GTGAAGCATC TACACAGAGA ACTTTCAAGG AAGAAATTCC TCTCTAATAA TTGGTTTAAG 
GCTAAGGTTA AGCTTGCTAG GGCTTATGAG CATTTGAAGA ATCTAAGAAC GGATCTTTAC 
ATGAAGTTGG GTAAGTGGTT TGCTGAGCAT TATGATGTTG TGGTGATGGA GGACATTCAT 
GTTAAGCAGT TGATAGGTAA GTCATTAAGG TCTCTGAGGA GGAGATTGAG TGATGTCGCG 
TTCAGCGAGC TTAGAGATTT GATTAAGTAT CAGTTGGAGA AATACGGTAA GAAACTCATC 
CTAGTTAATC CTGCATACAC TTCCAAAACT TGTGCTAAGT GCGGGTACGT AAAAGAAGAT 
CTGTCTCTAT CTGATCGTGT TTTCGTTTGT TCCAACTGTG GTTGGATTGC AGATCGTGAC 
TATAATGCTT CTCTTAACAT CTTACGTGGA TCGGGGTCGG AGCGACCCTT AGTGTGGAGC 
TCCGCCCTCT ACCAGTACTC TGGCATGGCA GAGCTGTGA

Protein sequence

MKLACKIYNT LRWADIYFYQ RDGKGLTQTE LRQLALDLRK QDDEYKQLYS QVVQQIADRY 
YEARQRFFEG LARFPKEKKP HKYYSLVYPQ YGWKILQVRE IRKGSKKNKK RLITLKLSNL 
GTFKVIIHRD FPLDKVKRVV VKLTRSERIY ITFVVEDYEF PKLPNTGKVV AIDVGIEKLI 
VTSDGEYFPN LRPYEKALWK VKHLHRELSR KKFLSNNWFK AKVKLARAYE HLKNLRTDLY 
MKLGKWFAEH YDVVVMEDIH VKQLIGKSLR SLRRRLSDVA FSELRDLIKY QLEKYGKKLI 
LVNPAYTSKT CAKCGYVKED LSLSDRVFVC SNCGWIADRD YNASLNILRG SGSERPLVWS 
SALYQYSGMA EL