Gene Ssol_1986 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1986
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1774418
End bp	1776067
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	35%
IMG OID
Product	thiamine pyrophosphate protein TPP binding domain protein
Protein accession	ACX92197
Protein GI	261602594
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCATCAG TTGCAGAAGT AATAATAAGA GTATTAGAAG ATAATGGAAT TCAAAGAATA 
TATGGAATTC CTGGAGATTC CATTGACCCT TTAGTTGACG CGATAAGAAA ATCTAAAGTA 
AAATACGTAC AAGTAAGACA TGAAGAAGGT GCAGCTTTAG CTGCCTCGGT CGAAGCGAAA 
ATAACTGGTA AGCCTTCAGC ATGTATGGGT ACTTCTGGTC CTGGATCAAT CCATTTATTA 
AATGGATTAT ACGATGCAAA AATGGATCAT GCTCCAGTAA TAGCGCTAAC TGGACAAGTA 
GAGTCAGATA TGATAGGTCA CGATTATTTT CAAGAAGTTA ACCTAACTAA GTTATTTGAT 
GATGTGGCAG TATATAATCA AATTTTAATT AACCCAGAAA ACGCGGAATA TATAATAAGG 
AGGGCTATAA GAGAGGCTAT TTCCAAAAGG GGAGTAGCTC ACATAAATTT ACCAGTAGAT 
ATTCTCAGAA AGTCCTCAGA ATATAAGGGT AGCAAGAATA CTGAAGTAGG TAAAGTTAAA 
TATTCGATAG ATTTTTCTAG AGCTAAGGAA TTAATCAAAG AAAGTGAGAA ACCAGTTTTA 
CTAATTGGAG GAGGGACTAG AGGCCTAGGT AAAGAGATAA ATAGGTTTGC TGAAAAAATA 
GGAGCACCAA TAATATATAC ATTAAATGGT AAGGGGATTT TACCAGATTT AGATCCTAAA 
GTTATGGGCG GAATAGGTCT TTTAGGAACT AAGCCTTCCA TAGAGGCGAT GGATAAGGCT 
GATTTATTAA TAATGTTAGG CGCATCATTT CCTTACGTTA ATTTTCTAAA TAAGAGTGCC 
AAAGTGATAC AGGTTGATAT AGATAATTCT AATATAGGTA AGAGGTTAGA TGTTAATCTC 
TCTTATCCGA TTCCAGTTGC TGAGTTCCTA AATATAGATA TCGAAGAGAA ATCAGATAAA 
TACTATGAAG AGTTAAAAGG AAAGAAGGAA GATTGGCTAG ATTCTATAAG TAAGCAGGAG 
AATAGTTTAG ATAAACCAAT GAAACCTCAG AGAGTAGCTT ATATAGTTTC CCAGAAGTGC 
AAGAAAGACG CAGTAATAGT TACTGATACT GGAAATGTAA CTATGTGGAC TGCTAGACAC 
TTTAGAGCTT CAGGAGAGCA AACCTTTATA TTTTCTGCTT GGCTAGGTTC AATGGGCATT 
GGAGTCCCAG GAAGTGTAGG AGCTTCTTTT GCTGTAGAAA ATAAAAGACA AGTTATTTCT 
TTTGTAGGAG ATGGAGGTTT TACTATGACT ATGATGGAAA TGATAACTGC TAAGAAATAT 
GATCTTCCAG TTAAAATAAT CGTTTATAAT AATTCTAAAT TAGGAATGAT AAAATTTGAA 
CAAGAAGTAA TGGGGTACCC AGAATGGGGA GTCGATTTAT ATAACCCAGA TTTCACAAAG 
ATAGCTGAAT CTATTGGATT TAAAGGATTT AGATTAGAAG AGCCAAAAGA GGCTGAGGAA 
ATAATAGAAG ATTTTCTAAA CACTAAAGGA CAGGCACTTT TAGATGCAAT AGTAGATCCA 
AATGAGAGAC CAATGCCACC TAAACTAACT TTTAAGCAAG CTGGAGAATA CGTTCTTTCA 
ATATTTAGAG AGAAATTAGA GGGTATTTAA

Protein sequence

MPSVAEVIIR VLEDNGIQRI YGIPGDSIDP LVDAIRKSKV KYVQVRHEEG AALAASVEAK 
ITGKPSACMG TSGPGSIHLL NGLYDAKMDH APVIALTGQV ESDMIGHDYF QEVNLTKLFD 
DVAVYNQILI NPENAEYIIR RAIREAISKR GVAHINLPVD ILRKSSEYKG SKNTEVGKVK 
YSIDFSRAKE LIKESEKPVL LIGGGTRGLG KEINRFAEKI GAPIIYTLNG KGILPDLDPK 
VMGGIGLLGT KPSIEAMDKA DLLIMLGASF PYVNFLNKSA KVIQVDIDNS NIGKRLDVNL 
SYPIPVAEFL NIDIEEKSDK YYEELKGKKE DWLDSISKQE NSLDKPMKPQ RVAYIVSQKC 
KKDAVIVTDT GNVTMWTARH FRASGEQTFI FSAWLGSMGI GVPGSVGASF AVENKRQVIS 
FVGDGGFTMT MMEMITAKKY DLPVKIIVYN NSKLGMIKFE QEVMGYPEWG VDLYNPDFTK 
IAESIGFKGF RLEEPKEAEE IIEDFLNTKG QALLDAIVDP NERPMPPKLT FKQAGEYVLS 
IFREKLEGI