Gene Ssol_1801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1801
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1604258
End bp	1605469
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	35%
IMG OID
Product	Nucleotidyl transferase
Protein accession	ACX92017
Protein GI	261602414
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0230412
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTAGCAG CGGGTAAAGG AGAGAGATTA GAACCAATAA CCCATACAAG ACCTAAACCT 
TTTGTTCCTG TTCTTGAAAC TCCCTTAATT TTAAGGCATA TTCGGATATT AAAGAAATAT 
ATAAATAAGA TTATAATTGT AATAAACTCT AACCATAAGG ATTATTTCAA AACTATTGAA 
GGAGTTAGTC TAGTTGAACA GACTGAAGGA AAAGGTACCG CTGCAGCTTT ACGAGCAGCC 
GAGAAATATC TTGAGGGAGA TGAAGAATTT TTAGTAATTT ACGGAGACCT TCTTTTTGAA 
GAAGATGCAT TGGATAAAAT AGTAAATACT GAGGGGGAGG CAATTCTAGC TAGAGAGTCT 
GAAGATCCTA GAAAATTTGG AGTTATAGTG AAAGACTCAG AAAATAGATT AGTGAGAATA 
GTCGAAAAGC CTGAGAATCC TCCGTCAAAT ATAATTAACG CAGGTATCTA TAAGTTTACC 
TATGATATTT TCTCATATAT TGATAAAATA AGTTTATCAA GTAGAGGTGA ATTTGAGCTT 
ACAGATGCTG TAAATCTTAT CGGAAATAAG GTTAAGGTAG TTACGTACAA TGGAATATGG 
TTAGATATAG GAAGGCCTTG GGATTTAATA GAAGCTAATA AGGTACTTTT AGATAAGGAG 
AAGGATCGAA ATCTAGGTGT AATCGAAGAA AATGTTAAAA TCAAAGGTAA AGTAGTTATT 
GAAGATGGGG TTATAATAAA ATCTGGTACC TATATAGAGG GTCCCGTTTA TATAGGTAAA 
AATTCTGTTA TCGGACCTAA TGCGTATATA AGGCCATATA GTGTGATAGG AAGTAACGTT 
AAGGTTGGTG CGTTTAACGA GATAAAGGAA AGCGTGATAA TGGAAAACGC AAAGATTCCG 
CATTTAAGTT ATGTCGGAGA CAGTGTAATC TGTGAGGGTG TAAATTTTGG AGCTGGAACT 
ATAACCGCGA ATTTGCGGTT TGATGAAGAG GAAGTTAAGG TTAATATAAA AAACGAAAGG 
GTAAGCAGTG GTAGAAAGAA ATTAGGTGCA ATAGTAGGTG CCCATGTAAG AACTGGGATT 
AATGTATCAA TATTGCCTGG GGTAAAGATT GGTGCATATG CTTGGATTTA TCCAGGAGCT 
GTTGTTGATA GAGATGTTGA GAAAGGAGAG AAATATGTTC CATATTACCT AAGAAGGTCT 
AGCGGTACTT GA

Protein sequence

MLAAGKGERL EPITHTRPKP FVPVLETPLI LRHIRILKKY INKIIIVINS NHKDYFKTIE 
GVSLVEQTEG KGTAAALRAA EKYLEGDEEF LVIYGDLLFE EDALDKIVNT EGEAILARES 
EDPRKFGVIV KDSENRLVRI VEKPENPPSN IINAGIYKFT YDIFSYIDKI SLSSRGEFEL 
TDAVNLIGNK VKVVTYNGIW LDIGRPWDLI EANKVLLDKE KDRNLGVIEE NVKIKGKVVI 
EDGVIIKSGT YIEGPVYIGK NSVIGPNAYI RPYSVIGSNV KVGAFNEIKE SVIMENAKIP 
HLSYVGDSVI CEGVNFGAGT ITANLRFDEE EVKVNIKNER VSSGRKKLGA IVGAHVRTGI 
NVSILPGVKI GAYAWIYPGA VVDRDVEKGE KYVPYYLRRS SGT