Gene Ssol_1526 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1526
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1397359
End bp	1398867
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	41%
IMG OID
Product	conserved hypothetical protein
Protein accession	ACX91753
Protein GI	261602150
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTAAAA GAAAAGCTGC ATATATATTA CTCTTAATAA TCGCATTACC GAGCTTAGCA 
TTACCAGTCA CAGCTGCAGC CAATCCAGTA GCAACGTTCA TTAATGATCT AGAGATATTA 
ATCCCAGCAG TATTGTTCAT TCTGTCATTG ATAGCACTAA GGAGCGGGGA TTATGAATAC 
TCGTTCATGC TGTTATTAGC AGCCACAATA GTAACTATAG CGCTGGCATC AGTAACCGGG 
GGGAATTTAG GGACTAACGG GGTTTCATTA ACACTAGTTC AGCTACAGGT GACTGTTAAC 
GGTCCCACGT CAGCTTATAC AGGCAATACA GAAACATACA CAGTCTCGTG GAGCCCTTCC 
ATGTCTGGAA CTGTAATATG GACTGTTCTA TATAATGGAA GTATAGTGTA CAACGCTACT 
GGAGGTACTT CTTTTACCTA TACTTTTAAG TATCCAGGTA AATACATAGT TGCAGCAACT 
GTAATTAATC AACAGAATTT TGCTGGAGGT TCTGGAGCAG TTCTGGTTAC AGTTACAAAT 
CCTCCTTCAC CTCTTGGGTG GATAGAAGGA GCAATCACAG GCGCAGTTTC TGGATTAATT 
AACTCTGTCG CTAATGCGTT TACAGGATTC CTAACAACAT TACTACAGAT TTTTGGAGCA 
CCTCTGGAAT GGATGACTTA TTCACCAACT CCTTACGCTT CTACTTCTAC TCCTAATGCT 
TCCCCAATAG TACCAACAAT TTACAACCAA ATGAAAGACT TTAGCGTTGG GCTCGCAATG 
CTTTTCATAG CTTTCTCAAT CGCCTATAAC GCTATAAGGG GAGAATATGC CGACCTCGTT 
GACCTTGCTG GAGACGTAAT GTATAAATTA TCTGTTTGGG GGTTGTTCTT CGCGGGCGGC 
CTAACAATTT ATACTTACGC TGCGAATTTC ATTAATTCTA TAATATATTC TGTTGCAGGA 
CCTTACTTAG GGATCGCGAC ACTTGAATAT ACAGGGGGAG CTACATTGTT TACTGCATTA 
TTTGCCTTAA TGAATGGTAT CCCGTTTGGG TTTGGTGATG CGTTATCAAT GTTCTTGTCC 
CTTGTTATGT TCTTATTAGC TATTACTTTA GCAATAGCAA CGATTAAGTA TGCTGTAATG 
CTAGCGATAG TAGACACAAT TCCCTTATGG GCTACTCTAT GGATATTCGA ATGGACTAGA 
AAAATTGCTA TGGTGGTCAT AGACTTATTG ATAGGACTTA TGGTTGTTGG GCTGATAGCT 
GCAGTAACAT TCGCTATATT GGCAACACTG CCATTGGGAG CGTTAATGTT TGCTATCGAC 
CCTATAGCTA TGGATGGGGA ATTTTTGTTC AGTCTGGCTT TCTTCGTCTT CGGACTAAGA 
CCAGGAGAAC ATATGATGGG AGCATTCAGA AAGAAAAACG AAGGAGGATC CGGAAATACC 
GTAGTAGTAG TAGAAAATAA TAGTGGCGGA TCTACGTCCT CAGAACCACC AGCTGGAAGA 
TATATGTAA

Protein sequence

MAKRKAAYIL LLIIALPSLA LPVTAAANPV ATFINDLEIL IPAVLFILSL IALRSGDYEY 
SFMLLLAATI VTIALASVTG GNLGTNGVSL TLVQLQVTVN GPTSAYTGNT ETYTVSWSPS 
MSGTVIWTVL YNGSIVYNAT GGTSFTYTFK YPGKYIVAAT VINQQNFAGG SGAVLVTVTN 
PPSPLGWIEG AITGAVSGLI NSVANAFTGF LTTLLQIFGA PLEWMTYSPT PYASTSTPNA 
SPIVPTIYNQ MKDFSVGLAM LFIAFSIAYN AIRGEYADLV DLAGDVMYKL SVWGLFFAGG 
LTIYTYAANF INSIIYSVAG PYLGIATLEY TGGATLFTAL FALMNGIPFG FGDALSMFLS 
LVMFLLAITL AIATIKYAVM LAIVDTIPLW ATLWIFEWTR KIAMVVIDLL IGLMVVGLIA 
AVTFAILATL PLGALMFAID PIAMDGEFLF SLAFFVFGLR PGEHMMGAFR KKNEGGSGNT 
VVVVENNSGG STSSEPPAGR YM