Gene Ssol_0802 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0802
Symbol
ID	0
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	749222
End bp	750708
Gene Length	1487 bp
Protein Length	495 aa
Translation table	11
GC content	39%
IMG OID
Product	glycoside hydrolase family 29 (alpha-L-fucosidase)
Protein accession	ACX91055
Protein GI	261601452
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.246166
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACAAA ATTCTTACAA AATCTTGAAA TCACTTCCAG TACCATCTAA TGGTCCTTTC 
AAACCTACTT GGAGTTCATT AAAAAAGTAT ATAGTCCCAT CGTGGTTTAC CACCTCTAAA 
TTCGGTATTT TTATCCATTG GGGAGTATAC TCAGTACCAG CATTTGGTAA TGAATGGTAC 
CCTAGATACA TGTACATGCC AGATAGACCA GAACACCAAT ATCACCTAAA AAATTCGGCC 
CAGTAACCGA TTTCGGATAT AAGGATTTCA TACCGATGTT CACTGGAGAG AATTGGGATC 
CATATGAGTG GGCTAAGGTC TTTAAGAAAA GTGGAGCTAA ATTCGTAGTC CTAGTTGCAG 
AACATCACGA TGGATTTGCA CTATGGGAAT CAAATTACAC TAGGTGGTGT GCAACCAAGA 
TTGGACCTAA AAGGGACATT GTTAGAGAAC TTAAGGAAGC TGTTGAAGGT CAAGGGCTAA 
TATTTGGCAT TTCGTATCAT AGGGCTGAGC ACTGGTGGTT TTTCGATCAA GGGATGAAAA 
TAGAGTCTGA TGTAAAGGAC CCCAGATATC TTGATTTATA TGGCCCAGCT CAGTCTGCTT 
CCCTAAATCC TAGAGATCCA CCTTCACTGG ATAATGTACA GCCAAATGAT GAGTTTCTAA 
TGGATTGGTT GCTTAGAATT GTTGAGGCTG TTGAAAAGTA TAGGCCATGG CTAGTCTATT 
TCGACTGGTG GATTGCCAAT CCCTCTTTCC AACCATATTT GAAGGCCTTT GCGTCCTATT 
ACTATAATAG GTCATATAAA TGGGGAATAG AACCCGTAAT AATTTACAAG CAAGGGGCAT 
TTGGGGAAGG TACAGCCATA CCGGATTTAG CTGAAAGGGG AACAATAAAG AACGTATATC 
CCTCCACATG GTTAGCTGAC ACTTCTATAG ACTACAAATC CTGGGGTTAC ATCAAAGATG 
CTGAATACAA GCTACCTAGT GTTATATTAT CCCATTTAGG TGATGTTGTT AGTAAAAATG 
GAGTTTTTCT CTTGAATATA GGACCTAAAG CTGACGGTAC GATACCAGAA GAGGCTAAGA 
GAATTCTACT TGATGTTGGG GATTGGCTAA ATGTAAATGG CGAAGCGATT TTCGGATCAA 
AACCGTGGAG AGTTTACGGA GAAGGTCCTT CTGGAATTAA TGAAGGGGGA TTCTTTACAG 
AGAGAAAAAT TACTTTAGGC TATCAAGATG TGAGATACAC TGTGAAAGAC TATTATCCGC 
GACAAAGGCA TATTTACGCT ATTCTCTTCG GAAAGCCTAA GGAAATTACG TTAAGGTCGT 
TTATGAAAAA TCTAAAGCTA ATAGAAGAAG CTGTAATAGT AGATGTAAGC AGATTAGATG 
GGAAAGGTAA GTTAGAGTGG AGTTTAAGTG ATGAAGGTTT AAAGATAAAA ATAGAGGAAG 
TTATAAGGGC TCCTCTTGTT ATAAGGGTTA TCCTAGATTA TAGATAG

Protein sequence

MSQNSYKILK SLPVPSNGPF KPTWSSLKKY IVPSWFTTSK FGIFIHWGVY SVPAFGNEWY 
PRYMYMPDRP EHQYHLKKFG PVTDFGYKDF IPMFTGENWD PYEWAKVFKK SGAKFVVLVA 
EHHDGFALWE SNYTRWCATK IGPKRDIVRE LKEAVEGQGL IFGISYHRAE HWWFFDQGMK 
IESDVKDPRY LDLYGPAQSA SLNPRDPPSL DNVQPNDEFL MDWLLRIVEA VEKYRPWLVY 
FDWWIANPSF QPYLKAFASY YYNRSYKWGI EPVIIYKQGA FGEGTAIPDL AERGTIKNVY 
PSTWLADTSI DYKSWGYIKD AEYKLPSVIL SHLGDVVSKN GVFLLNIGPK ADGTIPEEAK 
RILLDVGDWL NVNGEAIFGS KPWRVYGEGP SGINEGGFFT ERKITLGYQD VRYTVKDYYP 
RQRHIYAILF GKPKEITLRS FMKNLKLIEE AVIVDVSRLD GKGKLEWSLS DEGLKIKIEE 
VIRAPLVIRV ILDYR