Gene Ssol_2252 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2252
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	2035804
End bp	2037048
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	35%
IMG OID
Product	glycosyl transferase family 2
Protein accession	ACX92439
Protein GI	261602836
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTATACG AATTAGAAAA CGTGCTGTAT ATGCTTGAAT ACGGTGTCTT CATATATTTT 
CCAGTGAATT TTGCAATATT CTTCTTGTTT AGACAGTTTT TATTGCGCCA TTTCTCTAAA 
AGCTATAAAC CTTATATCAG TGGTTTAAGT AGAGATAAGG TAAAAGTAAG TGCAATAGTT 
CCAGAGTACG GTGAGAATCT TGAGATTTTT GAAAAATGTC TTAGATCAGT TGCAAAAAAT 
AAACCAGATG AGATAATAGT AGTCCACGAT GATAAGAGAA AGGAAGTAGT GGATATATCC 
AAAAAGTATG GTGCTAAGGT TATAAGCCTT AGTAGAAGGG TTGGTAAACG CGGTGCATTA 
ATCATAGGTT GGTTAAACGC AATTGGAGAT ATAATAGTTC AGTTAGATAG TGATACGATT 
ATGGAAGATA ATACTATTAA TGAAATCGTT AAACCGTTTG CGGACCCTAA GGTAGCTGGA 
GTTCAAGGGA GACCAGTATT ATTCAGAACT GATGGCAGAA TTCCCTATTT GTTTGGACAA 
ATAATAGAGT ATAGTAGGGA TATTGTTGTT AGAGCGTTAA ATGGAACGTT AAATGTGATT 
GATGGAAAGA TTGCCGCTTA CAGAAGAAGT TATCTACTAG AGACTATAAG GCATTTCAAT 
CACGAGACTT ACGGAAAGAG AAAACTAATT GCTGCAGACG ATAAAGCACT GACTTATTAC 
GCAAATATGA ATGGTTATAA GACAGTCTAT CAAGCTACGG CAGTGGCTAA ATCAGCGGCC 
CAACCTACGT TTTTAAAATT CCTCAACCAG CAGTTAAGAT GGGCTAGAAG CGGTTATCTT 
TACCTAATTA AGGAAATGAG GAGTGGCTTA TTTTTCAAAA TGCCCGGAAA ATATAGATTT 
CATATGTTAA CATATCTATT AGCTCCATTT TCATTTGCTT TGGCATTAAT AGACACGCTC 
TTAGTTCCTG GAAATCCCAC TGCATTGACT TGGAGTTATT TAGCCTATTA TGGATTTAAC 
ATACCTATAA TATTATATTC GCTCCTTATC TTTATTTTTG GTCTTTACTT AAGTATGAAA 
ATATCTTTTG GAATCTTGAA CCTTAAACTC CCAGATAAAA TATCCTTCGT TGATCTTATT 
ACACTAGGCA TTCTCGGTTT ATTCGTAATA TTCCCCATGT TTATATATGC AGCAATCACC 
CATTACGGTG TTTCCGAATG GAGGGGAAGT AGCTATTTGG GTTAG

Protein sequence

MLYELENVLY MLEYGVFIYF PVNFAIFFLF RQFLLRHFSK SYKPYISGLS RDKVKVSAIV 
PEYGENLEIF EKCLRSVAKN KPDEIIVVHD DKRKEVVDIS KKYGAKVISL SRRVGKRGAL 
IIGWLNAIGD IIVQLDSDTI MEDNTINEIV KPFADPKVAG VQGRPVLFRT DGRIPYLFGQ 
IIEYSRDIVV RALNGTLNVI DGKIAAYRRS YLLETIRHFN HETYGKRKLI AADDKALTYY 
ANMNGYKTVY QATAVAKSAA QPTFLKFLNQ QLRWARSGYL YLIKEMRSGL FFKMPGKYRF 
HMLTYLLAPF SFALALIDTL LVPGNPTALT WSYLAYYGFN IPIILYSLLI FIFGLYLSMK 
ISFGILNLKL PDKISFVDLI TLGILGLFVI FPMFIYAAIT HYGVSEWRGS SYLG