Gene Ssol_1255 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1255
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1164356
End bp	1165636
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	32%
IMG OID
Product	histidyl-tRNA synthetase
Protein accession	ACX91491
Protein GI	261601888
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.505298
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAAAGT TTGAAACAGT AAGAGGCATG AAAGATTATA TTGGAATCGA TGCAGAAAAA 
ATTAGATACT TGGAATCTAC CTTTAGAGAC TTAGCAAAAA AATATGGATA TTCTGAAATT 
ATAACGCCAG TAGTAGAAGA ATTTAAACTG TTTGAGTTGA AGGGTGGGGA GGAACTAAGA 
CAAACGATGT ATGTGTTTAA GGACAAGGCA GATAGAGAGA TATCGTTACG ACCTGAAATA 
ACACCAAGTG TAGCAAGAGC ATACATACAA AATTTACAGA GTTCGCCAAA GCCGATAAGG 
CTATTTTACT TTGGTACCGT TTATAGGTAT GACGAACCCC AGTACGGCAG ATATAGAGAG 
TTCAGACAAG CCGGAATAGA AATGATAGGT GATTCTTCCA TCTTAGCTGA TGTAGAAGTA 
TTAGATTTAT TGTACAATTT TTATGATAAG CTTAATCTTT CTAAGGATAT AACAATTAAA 
ATAAATAACA TTGGTATATT TAGAAAAATA ATGGATAAAT ATAATATCGA AGATAATCTA 
CAAGAGCATG TTCTGCATTT AATAGATAAG AATAAGGTTG ACGAAGCTTT AGTTATTCTT 
GAAAAAAATA TAAAGAATAA GGATATAATG GACTTTTTAA ATATGATCCT TACTAAAAAA 
GAGGCAAAAC TAGAAGATAT AGAATCCTTA GCTGAATTAG AGGAAGTTTC AAAATTAGAT 
ATTAAAAACG AATTTGAATA TCTACTTCGA TTATCTAGAA TTTTAAGCAG CTTAAATGTA 
AAATTTAAGG TTGACCTAGG TTTTGTAAGA GGATTAGCTT ATTATACTGG ACTAATATTT 
GAGGTTCTTC ATCCCTCTGT TCAGTTTAGC ATTGCTGGAG GAGGAAGATA TGATAAACTT 
ATAGAGCTCT ATGGTGGCTT ACCCTCACCA GCAATAGGAT TCGCTATAGG AGTTGAGAGA 
ACTTTATTAG TAATTAAAGA TCTGAAAGTT GAAGAACCAA TAAATGTGAT AGTAGTAGGC 
ATCTCAGAGG AGGCAATACC AGCTATGTTT ACGGTATCCA GAATGTTAAG AAAGGAAGAA 
TATAAGGTAG TAATAAATAC TAAAGATCAG CCTCTCTCTA AACTATTACC TTATTATGCT 
TCCCAAGGAT TTAAACTCGC AATAATAATA GGTAAACAAG AACTTGAGAA AAATATGATA 
ACAGTTAGAA ATTTAATTAC ACGAAAACAG ATTTCTATCC CACTAGAGAA CGTTCTAGAT 
GCAATAAAAC AAACGTTATA A

Protein sequence

MVKFETVRGM KDYIGIDAEK IRYLESTFRD LAKKYGYSEI ITPVVEEFKL FELKGGEELR 
QTMYVFKDKA DREISLRPEI TPSVARAYIQ NLQSSPKPIR LFYFGTVYRY DEPQYGRYRE 
FRQAGIEMIG DSSILADVEV LDLLYNFYDK LNLSKDITIK INNIGIFRKI MDKYNIEDNL 
QEHVLHLIDK NKVDEALVIL EKNIKNKDIM DFLNMILTKK EAKLEDIESL AELEEVSKLD 
IKNEFEYLLR LSRILSSLNV KFKVDLGFVR GLAYYTGLIF EVLHPSVQFS IAGGGRYDKL 
IELYGGLPSP AIGFAIGVER TLLVIKDLKV EEPINVIVVG ISEEAIPAMF TVSRMLRKEE 
YKVVINTKDQ PLSKLLPYYA SQGFKLAIII GKQELEKNMI TVRNLITRKQ ISIPLENVLD 
AIKQTL