Gene Ssol_2510 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2510
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	2308451
End bp	2309857
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	34%
IMG OID
Product	polysaccharide biosynthesis protein
Protein accession	ACX92642
Protein GI	261603039
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCCA TTAAGAATGC ATTGAAGAAC CTAAGCGTCA CAACAACTAA TGTAATAATT 
GCTTTAATTT TCTTCGTTAT TACAGCTAAG ATTTCTAGTC CAGCATTCTT CGGAAAAGTT 
GTGATAGTTC AATTACTTGA GATAGTAACG TCGACTTTCT TTTACTTTAT TCCAGGCCAA 
ATAATAACTA GGGAAATATC TTATCTTTAC GCTAAAAAAG AGATAACTAA AGAGGTAGTA 
GGAAAATTCC TTTCATTTCC TTTTCTAGTT TTACCGATTT TCCTCATCCT TCTTATTTTT 
CCAGATTACG TTAAGTTAGC AATACCTTAT CTTTTCCTTT ACCTCCTTAA TGGCGTAATG 
ACAGCAGTGA TGATAGGAAT GGATATGTTT ACAGAATCTG CAATTACTGG AAACTTCTTT 
CTAGTCATAA GATGGGGGAT AGCAATAATC GCTGTTCTCT ACCACAATAT ATATCTCTTC 
GTTAAAATTT GGACTTTGGG AGGAATTCTC TCAGTATCTA TGAATTACGC ATTTATTAGC 
AAAAAGGTTG GGTTAGTACT TCCTACGCCA GACTTTGCCT TTCTCTTTAG GCATTTTAGG 
GAAGGTTTAC CTGTTTATTT ATCTTCTTTT GCTGGTTTTC TTTCCTCCCA AGGGGATAGG 
GTAACTACTG CGTATTTGCT AGGTTCTTAT TATCTGGGCA TTTATCAGTT TTCAGCTTTA 
GTTGCTGGTG TTCCCTCAAT GATTTTAGGT GCCTTAGGTG GGGTTTTGTT ACCTACCGCG 
TCATTTTATA AGGCTTTAGG GAAGGATGAA AAGAAGATGT CGTCTCTTTC TTTTATATTC 
CTCTCGCTTT TAACTTTTCT AACAGTAATA ATTTCTATTC CGATAGGTGA GATCATAATT 
ATTCATTTCT TTCCTAATTA TAAAGAGGGA TTAGAAGTAT TCGTGTTACT CTTGATTTCG 
GCTACTCTTC CGTTTCCTAT AGGTTCTCTT ACGAATTTTA TTGTAGCGTT CAAGAGAAAC 
TTAAGACCTT TCCTTATCCT TTCAATTTTA AACGGAAGTT TAGTCTTACT TACTTCCTAT 
TTATTAATTC CGAGGATAGG AATAATGGGT GGTGCTATAT CTCAAGTTAT AGTAGCTACA 
ATTTCTTCTC TCTTTATCAT ATTTTACTCT ATAAGAACAT CGGTATTTTC AACTGGAAGG 
AAAGAAATAA TTTTACTTTT CCTCATACCC GTAGTAGGAA TTTATGAGGC TATAGATCCT 
CCGTTTCTAG ATTTTCTCCT AATTCTTCTT ATACTTTTAG TGTTTAAACT GTTTAAAATA 
ATCACTGAAG AGGACGTTAA AATAATTGAA GGTTTCTTGC CACATGGGTT AAAATTCGTG 
TCGAAAATTT TAAGTAAACT AACGTAA

Protein sequence

MNPIKNALKN LSVTTTNVII ALIFFVITAK ISSPAFFGKV VIVQLLEIVT STFFYFIPGQ 
IITREISYLY AKKEITKEVV GKFLSFPFLV LPIFLILLIF PDYVKLAIPY LFLYLLNGVM 
TAVMIGMDMF TESAITGNFF LVIRWGIAII AVLYHNIYLF VKIWTLGGIL SVSMNYAFIS 
KKVGLVLPTP DFAFLFRHFR EGLPVYLSSF AGFLSSQGDR VTTAYLLGSY YLGIYQFSAL 
VAGVPSMILG ALGGVLLPTA SFYKALGKDE KKMSSLSFIF LSLLTFLTVI ISIPIGEIII 
IHFFPNYKEG LEVFVLLLIS ATLPFPIGSL TNFIVAFKRN LRPFLILSIL NGSLVLLTSY 
LLIPRIGIMG GAISQVIVAT ISSLFIIFYS IRTSVFSTGR KEIILLFLIP VVGIYEAIDP 
PFLDFLLILL ILLVFKLFKI ITEEDVKIIE GFLPHGLKFV SKILSKLT