Gene Ssol_1251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1251
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1161341
End bp	1162852
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	32%
IMG OID
Product	tRNA-guanine transglycosylase, various specificities
Protein accession	ACX91487
Protein GI	261601884
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGTAT TTGAAGTAAA ATATGAGGAC TTAGCAGGGA GAATAGGAAC CTTAAGAACA 
AGAAGTGGTA CCTTAGAAAC TCCAGCATTC TTTCCAGTAA TTAACGTATT AAAAAAAGAT 
GAAATATCGA TAGATGAGAT AAGAAATATA GGATTTAAAA ACTTTATCAC AAATTCTTAC 
ATATTATACA AAAATAACTA TATAAAGGAT GATATCCATA AGGAGTTACG CTCTGAAGAA 
ATGATCATAA TGACAGATTC AGGGGCATAT CAAATTCTAG AGTATGGAGA AATAGGAATA 
ACCAATCTCC AGATCGTGAA TTATCAGCTT AAAATAAAAC CAGATATCGG AGTAATATTA 
GATTTACCTA CCGGGAATAT AAATGATTAT GATAACGCTA AAAAGACAGT ATATGAGACA 
TTAAAAAGAG CGGAAGAAGC TTCAGAAATC ATAGTAAAAA ATCAAGATAA CAATATCATT 
TGGGTATATC CAATACAGGG AGGAAGATAT CTTGATCTAG TTAAGACTTC TGCTGAAGGT 
CTATCTAAAT TTGAACATAT ATACAATATG GCCGCTCTTG GTAGCCCAAC AGTTCTCTTA 
GAGAAGTACA TGTATGATAC TGTAATTGAC ATGATTTATA CTGCTAAATC TAACATAAAA 
AGAGGAATCC CGTTTCATCT ATTTGGAGGA GGGTTACCTC ATATCATTCC ATTTGCAGTA 
GCGTTAGGAG TTGACAGTTT TGACTCTGCT TCATATATAA TATATGCCAG AGACAATAGA 
TATATTACTA GGACACGCGT ATACAAATTA GAGGATTTAG AATATTTTCC ATGTTCTTGT 
CCAATATGCT CTAAATACAC ACCTAAGGAT TTACTTGAAA TGAATGAGAA AGAAAGAACA 
AAAGCATTGG CTATTCATAA CCTTTATACT ATTTTAGAAG AATTTAAAGC AACTAAACAG 
GCGATTAAGG AAGGAAGATT ATTTGAATAT CTCCAAGAAA AAGCTTACTC TCATCCAGCA 
GTATATTCTG CATTCAAACG ATTGATGAAA TATAAGGATT ATCTAGAGAA ATTTGACCCT 
AGAATAAGGG GAGATCCAAA AGGTTTGTTT TTATTTGACG GTAACTCTTT ACATAGGCCA 
GAAATTATAC GTCACTCGAG ATTTCTAGAA AGATACATAC AAAAGAAAGA TAAAATATCC 
ATATATTGCT ATGATAAAGC AATAAGTGAT ACTGCTTATG ATTTCAAGGA AAAAATAAGG 
GAAAAAATAG CTGATCGTAA TGAGAGCGAC GTATTTATAG CAGTACCGTT TTTTGGTTTA 
ATACCGTTAG AGATCTCAGA TTCTTATCCT CTATCTCAAT TCGAGATACC AAATGAAATA 
GATGAAGATG TAATAGACGA TATGAAAACT AAAATCATTT CGTTCTTAAG ACGTAATAAT 
TACCAAAAAG TAGAGTTAAT TAACTGTGAA AAACTAGGCT TACATATAGA CTCTATCAGC 
ACTTCCTCTT GA

Protein sequence

MTVFEVKYED LAGRIGTLRT RSGTLETPAF FPVINVLKKD EISIDEIRNI GFKNFITNSY 
ILYKNNYIKD DIHKELRSEE MIIMTDSGAY QILEYGEIGI TNLQIVNYQL KIKPDIGVIL 
DLPTGNINDY DNAKKTVYET LKRAEEASEI IVKNQDNNII WVYPIQGGRY LDLVKTSAEG 
LSKFEHIYNM AALGSPTVLL EKYMYDTVID MIYTAKSNIK RGIPFHLFGG GLPHIIPFAV 
ALGVDSFDSA SYIIYARDNR YITRTRVYKL EDLEYFPCSC PICSKYTPKD LLEMNEKERT 
KALAIHNLYT ILEEFKATKQ AIKEGRLFEY LQEKAYSHPA VYSAFKRLMK YKDYLEKFDP 
RIRGDPKGLF LFDGNSLHRP EIIRHSRFLE RYIQKKDKIS IYCYDKAISD TAYDFKEKIR 
EKIADRNESD VFIAVPFFGL IPLEISDSYP LSQFEIPNEI DEDVIDDMKT KIISFLRRNN 
YQKVELINCE KLGLHIDSIS TSS