Gene Ssol_0097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0097
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	82022
End bp	83434
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	35%
IMG OID
Product	cysteinyl-tRNA synthetase
Protein accession	ACX90398
Protein GI	261600795
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0748352
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTTTA GAATTAGGGT ATACAATTCG CTTGGGAGAA AGCTAGAGGA ATTTGGTACA 
GTAGAGCCGA ATCTAGTGAA AATGTACGTC TGCGGCCCTA CAGTTTATGA CTATGTTCAT 
ATAGGTCATG GAAGAACTTT CGTGGTATTT GACGCCATTT CAAGATATTT AAGGTTAAGA 
GGCTATACCG TAATTAGAGT TCAGAATATT ACAGACATTG ATGACAAAAT AATTAAAAAA 
TCACAAGAGA TTGGAAAAGA TTGGAATGAA ATCGTTGATT ATTTCACAAA GGATTACTTA 
GATATGCTGT CTCAACTTAA AGTCAAAATA GATATACACC CACGTGTAAC ACAGCATATA 
AGGGAAATCA TTGATTTCGT ACAGAGACTG ATAGATAAGG GACATGCATA TGTAGCGCCT 
AGTGGTAGTG TGTACTTTGA TGTTGATACT TATCCTAATT ATGGGGAACT TTCAAACACT 
AAAAAAGAAG AATGGAATCA AGGAGAAGAA TTCGTCAAGG AGAAGAAGCA TTCCTACGAC 
TTCGCATTAT GGAAAGCGTG GAAGCCGGGT GAACCTTATT GGGAATCACC TTGGGGTAAG 
GGAAGACCTG GATGGCACAT CGAATGTTCA ACTATGTCAA CTAGGTATCT AGGTGAAAGA 
TTTGATATTC ATGGAGGAGG AGCTGATTTG ATATTTCCGC ATCATGAAAA TGAAAGAGCT 
CAGACTGAGG CATTAATTGG GGAGAAATGG GTTACATACT GGGTTCATAG CGCTTTTGTA 
ACCATAAGAA AAGAAAAGAT GAGTAAATCC TTGGGTAATA TAATACCATT AAATGAGGCT 
ATAAAGAAAT GGGGACCCTC GGTTTTGAGA TATTGGTATT TGACCTCTCA TTATAGATCA 
CCAATAGACT TTTCTGAGGA AGCCTTAGAG CAAGCAAAAT CCGCTTTACA GAGAATAAAA 
GATTCAATGG CAATAATTAG AGATGTAATA TCTGAGGGAC CTAAGTTCTA TGTTAAAGAT 
GATGATATCA AAGTATATAG AGAGATACTT AATAATCTAA ATAACTTCCA TACAGCCATG 
AGTAATGATT TCGACACATC TACAGCCTTA TCATATATAC ACGAGATAGT AAGATTAGTA 
TTCTCCACAT TACAATATAG TAGAGATTTC CTTGGGGCTA TGTTAGCCTT CGAAACCCTT 
AAACAATTCA ATGAAGTATT TGGAGTAATG GATGAAGAAT TCTATCCCAC ATATGATAAG 
ATGTATAAAA TAATAGATGC AGTTGTAGAT ATAAGAAATC AATTGAGACA GATGAAATTA 
TACGAAATTT CAGATAAGAT AAGGGAAGAA TTACTAAAGG CTGGAGTAAG GATATTAGAC 
AGTAAGGATA AATCTACTTG GAGATTTGAA TGA

Protein sequence

MDFRIRVYNS LGRKLEEFGT VEPNLVKMYV CGPTVYDYVH IGHGRTFVVF DAISRYLRLR 
GYTVIRVQNI TDIDDKIIKK SQEIGKDWNE IVDYFTKDYL DMLSQLKVKI DIHPRVTQHI 
REIIDFVQRL IDKGHAYVAP SGSVYFDVDT YPNYGELSNT KKEEWNQGEE FVKEKKHSYD 
FALWKAWKPG EPYWESPWGK GRPGWHIECS TMSTRYLGER FDIHGGGADL IFPHHENERA 
QTEALIGEKW VTYWVHSAFV TIRKEKMSKS LGNIIPLNEA IKKWGPSVLR YWYLTSHYRS 
PIDFSEEALE QAKSALQRIK DSMAIIRDVI SEGPKFYVKD DDIKVYREIL NNLNNFHTAM 
SNDFDTSTAL SYIHEIVRLV FSTLQYSRDF LGAMLAFETL KQFNEVFGVM DEEFYPTYDK 
MYKIIDAVVD IRNQLRQMKL YEISDKIREE LLKAGVRILD SKDKSTWRFE