Gene Ssol_0587 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0587
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	535142
End bp	536737
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	38%
IMG OID
Product	thiamine pyrophosphate protein domain protein TPP-binding protein
Protein accession	ACX90863
Protein GI	261601260
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0776726
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCAAAA CTACGTCCGA GCTTCTAATT GATACGATTT CTTCTCAAGT TACCGACGTA 
TTCGGGATAC CTGGAACCCA TGGTTTATCA TTATACGAGG AGCTCAGAAA AAGGGTAAGT 
AGAGGGGAAA TTAGATACTA TATGCCTAGA TTAGAATACG GAGGGGCAAT AATGGCAGAC 
TATTATGCTA GATTAAAGGG AAATGTGGGA GTTTTCTTAT CAGTAAATGG TCCTGGCTTT 
ACTAATTCTT TAACTGCTCT GGTCGGCGCT TATTCTGAAG GTTCTCCTCT TGTCCTTATC 
TCCCTCAATA AGGAATTTAA ATATAGACAT AGGAGACAAC TTCACGATTC TGGCTATTAC 
GACTTACAGT TAGAAATGGC CAGACAAGCA ACTAAGGCAT CATTTAGAAT TTACTCTCCA 
GAAGATGTGC CAATTATAAT GGAAAGGGCT TTTAAAATAG CTCTCGAAGA TAAGATGGGA 
CCGGTTTACA TTGAGGTTCC GGTCGATGTA TTGGAAGAGA AAGGTGATTT TGAGAATTAT 
AAGATTAAGA AGGTTAATAG AACATTAATT TATCCTACGA AAGAGGAAGT AAGGGAAGCG 
TTAAATTTCT TGAGTGAGTG TTCTAAACCA ATTCTACTAT TAGGTTATGG TGCGTCTAGA 
TCGAACATCT TGAACTACAT TGAAAAATTA GGGATTCCCG TATTCACCAC AATAAGGGGT 
AAGGGAAGCA TTCCGGAGAA TCATCCCTTA TATGCTGGAA CAATATTTAA CCTCAAGGAG 
ATACCAGGGG ATTGCCTCAT AGCACTAGGG ACATCATTTA ACGATCTCGA AACTAGTAGA 
TGGAGCATTA AATTGCCGGA TAGGATACTT CACGTGGATC CGGACGTTAA CGTATTTAAC 
ACCTCAATAA ATGCAGAAGT TACTATAAAA GCAAGTGCCG AAGCTTTTCT AGAGGAGATC 
GTTGAGAAGG TTAATTTGCC TAAATGGAGT TATAAAGTGG AGGAAAAGAA CAGCGATATA 
GTTGATAACA CAAGTGAAAT AACTCATGAT TACTTAGCTA AAGTTTTAGA TGAGACGTTA 
AGTGAAGATA GGGTTATCAT CTCTGATGCA GGGACAAATC AAGTTATGGC AATGGATATA 
AAAGTGTATA AACCGAACTC ATACTTTAAT TCGCTTATCT TTAACGCAAT GGGATCTGCT 
ATTCCAGCTA GCATAGGGGG TAAAATTGCA TCTCCAGAGA GGCAAATAGT GAGTATTATA 
GGAGATCTAG GATTTCAAGG ATGTTTTAAT GAACTAATTA CTGCAGCACA GTATAAGATC 
AACTTCTTAA CAGTTTTAGT AGAGGATGGT GTACAGCACT TCCTAAGGTT AAATCAGAAA 
ATGAGATATG GAAATACTTT TACAACTGAT GTATTTCAAA TAGATTACAC TAAGGTTGTG 
GAAGGGATTG GGGTTAACGT AATTGAGGTT AAGGATAGGA AAGACCTTAA GAAAAGTGTA 
GAAGAGGCCG TTGGATTATC TCTCAAGAGT CCAACAGTTC TAAGAGTTCA CGTTAGCCCT 
AATAGTATAC CTTCTAGATT GTTAATGAAA AGATAG

Protein sequence

MGKTTSELLI DTISSQVTDV FGIPGTHGLS LYEELRKRVS RGEIRYYMPR LEYGGAIMAD 
YYARLKGNVG VFLSVNGPGF TNSLTALVGA YSEGSPLVLI SLNKEFKYRH RRQLHDSGYY 
DLQLEMARQA TKASFRIYSP EDVPIIMERA FKIALEDKMG PVYIEVPVDV LEEKGDFENY 
KIKKVNRTLI YPTKEEVREA LNFLSECSKP ILLLGYGASR SNILNYIEKL GIPVFTTIRG 
KGSIPENHPL YAGTIFNLKE IPGDCLIALG TSFNDLETSR WSIKLPDRIL HVDPDVNVFN 
TSINAEVTIK ASAEAFLEEI VEKVNLPKWS YKVEEKNSDI VDNTSEITHD YLAKVLDETL 
SEDRVIISDA GTNQVMAMDI KVYKPNSYFN SLIFNAMGSA IPASIGGKIA SPERQIVSII 
GDLGFQGCFN ELITAAQYKI NFLTVLVEDG VQHFLRLNQK MRYGNTFTTD VFQIDYTKVV 
EGIGVNVIEV KDRKDLKKSV EEAVGLSLKS PTVLRVHVSP NSIPSRLLMK R