Gene Ssol_0601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0601
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	547286
End bp	548485
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	42%
IMG OID
Product	transposase, IS605 OrfB family
Protein accession	ACX90875
Protein GI	261601272
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000137299
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCACCT TAGGGTTTCG CTTCCGTGCA CACACTGACG AACAAACCCT TAGGGCGTTA 
AAGGCCCAGT TGAAGTTAGC ATGTGAGGTA TATAACACCT TAAGGTGGGC AGACATCTAT 
TTCTATCAGA GGGATGGGAA AGGACTAACA CAAACTGAGT TAAGACAGTT GGCTCTAGAT 
CTGAGAAAAC AAGATGATGA GTATAAGCAA GTCTACTCGC AAGTAGTTCA ACAAATAGCT 
GACCGTTATT ACGAAGCTAA GAAGAGGTTT TTCGAAGGTT TAGCACGTTT CCCGAAAGAA 
AAGAAACCTC ACAAATACTA CTCCCTAGTC TATCCCCAGT ATGGTTGGAA AATACTTCAA 
GTTAGAGAAA TAAGAAAAGG AAGCAAGAAG AAACTAATAA CGCTTAAACT ATCAAATCTA 
GGTGTGTTCA AGGTAATAGT TCACCGAGAC TTTCCCCTTG ACAAAGTAAA GAGGGTAGTA 
GTGAAGCTAA CAAGATCTGA GAGGATTTAC ATCACTTTCG TAGTAGAAGG TTACGAATTC 
CCCAAGTTAC CTAACACTGG TAAGGTAGTG GCGATAGATG TTGGTGTAGA AAAGTTGTTA 
GTAACGTCAG ATAGTGAGTA TTTTCCTAAT TTGAGACCTC TTGAAAAGGC GTTATGGAAA 
GTGAAGCATC TACACAGAGA ACTTTCAAGG AAGAAATTCC TCTCTAATAA TTGGTTTAAG 
GCTAAGGTTA AGCTTGCTAG GGCTTATGAG CATTTGAAGA ATCTAAGAAC GGATCTTTAC 
ATGAAGTTGG GTAAGTGGTT TGCTGAGCAT TATGACGTTG TGGTGATGGA GGACATTCAT 
GTTAAGCAGT TGATAGGTAA GTCATTAAGG TCTCTGAGGA GGAGATTGAG TGACGTCGCG 
TTCAGCGAGC TTAGAGATTT GATTAAGTAT CAGTTGGAGA AATACGGTAA GAAACTCATC 
CTGGTCAACC CAGCATACAC TTCCAAAACT TGTGCTAGGT GCGGGTACGT AAAAGAAGAT 
CTGTCTCTAT CTGATCGTGT TTTCGTTTGT TCCAACTGTG GTTGGATTGC AGATCGTGAC 
TATAATGCTT CTCTTAACAT CTTACGTGGA TCGGGGTCGG AGCGATCCTT AGTGCCTGTG 
GAGCTCCGCC CTCTACCAGT ACCAGCACTT CGGTACTGGC ATGGCAGAGC TGTGAAGTAG

Protein sequence

MPTLGFRFRA HTDEQTLRAL KAQLKLACEV YNTLRWADIY FYQRDGKGLT QTELRQLALD 
LRKQDDEYKQ VYSQVVQQIA DRYYEAKKRF FEGLARFPKE KKPHKYYSLV YPQYGWKILQ 
VREIRKGSKK KLITLKLSNL GVFKVIVHRD FPLDKVKRVV VKLTRSERIY ITFVVEGYEF 
PKLPNTGKVV AIDVGVEKLL VTSDSEYFPN LRPLEKALWK VKHLHRELSR KKFLSNNWFK 
AKVKLARAYE HLKNLRTDLY MKLGKWFAEH YDVVVMEDIH VKQLIGKSLR SLRRRLSDVA 
FSELRDLIKY QLEKYGKKLI LVNPAYTSKT CARCGYVKED LSLSDRVFVC SNCGWIADRD 
YNASLNILRG SGSERSLVPV ELRPLPVPAL RYWHGRAVK