Gene Ssol_1431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1431
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1320909
End bp	1322069
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	36%
IMG OID
Product	tryptophanyl-tRNA synthetase
Protein accession	ACX91664
Protein GI	261602061
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.494991
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATTTTC TTACTACAAT GCCAGATGAA TTTACTGTAA CTCCTTGGGA AGTTAAGGGT 
AAAGTTGATT ATGATAAACT AATTGTTCAA TTTGGTACTC AGAAAATTAC AGAAGAGCTG 
AAACAAAGAA TTAAGAACTT AGCTGGGGAT TTGCATGTCA TGCTCAGGAG AAACGTATTT 
TTTTCTCATA GGGATTTAGA TTTAGTTTTA AATGACTATG AGAAAAGTAA AGGATTCTTC 
CTATATACTG GAAGAGCGCC TTCCTTAGGT ATGCATATAG GACATCTGAT ACCATTCATA 
TTTACCAAAT GGCTACAAGA GAAATTTAAT GCTAATTTAT ACATTGAGAT AACTGACGAC 
GAGAAGTACA TGAGAAATCC AGAATTTACA TTAGATCAAA CTAGGAGTTG GGCTTACGAT 
AATATTTTAG ATATAATCGC TGTTGGCTTT AATCCCGATA AAACGTTCAT CTTCCAAGAT 
ACAGAGTACA TAAGGAATAT GTATCCTATA ACAGTGAAAA TAGCAAAGAA GCTGACGTTT 
TCAGAAGTAA GAGCTACTTT TGGATTAGAC GCATCCTCAA ATATAGGTCT CATATTTTAC 
CCAGCCCTAC AGATAGCTCC TACCATGTTT GAAAAGAAGA GATGTCTAAT ACCAGCCGGT 
ATAGATCAAG ATCCCTATTG GAGATTGCAA AGGGATATAG CGGAAAGCCT TGGGTATTAT 
AAGGCTGCGC AGATACATAG TAAATTCCTT CCCCCACTCA CGGGTCCAGA GGGCAAGATG 
AGTTCTTCAA ACCCAGAAAC GGCAATATAT CTTGTAGATG ATCCTAAAAC CGTGGAAAGG 
AAAATCATGA AATACGCATT TTCAGGGGGA CAACCCACAA TAGAGTTACA TAGGAAATAT 
GGCGGAAACC CGGAAATAGA TGTTCCCTTT CAGTGGTTAT ATTACTTCTT TGAGGAGGAT 
GATAATAGGA TTAAGGAGAT TGAGGAGGAG TATAGATCAG GCAAGATGTT AACCGGTGAG 
TTAAAACAGA TATTAATAGA CAAACTAAAT AATTTCTTAG AAGAACACAG AAGAAGGAGG 
GAAGAAGCAA AAGAACTTGT ACATGTATTT AAATATGATG GTAAATTAGC TAAGCAGATG 
TGGGAGAAGA TTCACGAATA G

Protein sequence

MYFLTTMPDE FTVTPWEVKG KVDYDKLIVQ FGTQKITEEL KQRIKNLAGD LHVMLRRNVF 
FSHRDLDLVL NDYEKSKGFF LYTGRAPSLG MHIGHLIPFI FTKWLQEKFN ANLYIEITDD 
EKYMRNPEFT LDQTRSWAYD NILDIIAVGF NPDKTFIFQD TEYIRNMYPI TVKIAKKLTF 
SEVRATFGLD ASSNIGLIFY PALQIAPTMF EKKRCLIPAG IDQDPYWRLQ RDIAESLGYY 
KAAQIHSKFL PPLTGPEGKM SSSNPETAIY LVDDPKTVER KIMKYAFSGG QPTIELHRKY 
GGNPEIDVPF QWLYYFFEED DNRIKEIEEE YRSGKMLTGE LKQILIDKLN NFLEEHRRRR 
EEAKELVHVF KYDGKLAKQM WEKIHE