Gene Ssol_2571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2571
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	2362647
End bp	2363786
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	36%
IMG OID
Product	peptidase U32
Protein accession	ACX92684
Protein GI	261603081
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.746078
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTTGG TAGTTGCGAC AAATTTTGAT GATTCCTTGT TAGAAGGATT AAAGAGGTAC 
CCGGATGTTA AATATATTTT CGGTAGTTTT AAGAGGACTA TAACAGGACA TGGTAGGGCT 
GGTTTTATTG TACCCCATAT TAAGGAAGAA CAATTCGAGA CTCATATTAG TTTAGCGCAC 
TCCTATGGTA TAAAATTTCT TTACACAATG AATACTAACA CGTTATTAGG CAAGGAATAT 
GATACGGAAT TTATTGGTAA AGTAATGAAA GAGGTTGACA AGTTAGTAAA TTTCGGAGTT 
GATGGTTTTA TAGTTGCATT GCCGTTTCTG ATAAGACTTA TAAGAACTGA ATACCCTGAC 
TTGGAAGTTT CTGCGTCTTC CTTTTCTAGA ATTCGGAACG TAAGGGAAGT TGAGGAGTAT 
ACGAATTTAG GCGTTAACAC TATAATTATG CATGAGGATG CAAATAGGGA TTTCAAATTA 
CTGAAAGAAG TGGCTGCATT ATCAAGAGCT AATAGATTTG AAATAGAATT AATACTTAAT 
AATTCTTGTC TTTATGGATG TCCATTTAGA CTTACACATG ATAATATTTC CTCAGTCACT 
TCAATGGTAA ACGGAGTAAA TGACGTTTGG TTTGAGTACC CCGTACTGTT ATGTGCAACC 
GATGTTTTAA ACGACCCAGC GAATTTGATA AGGAGTAGGT GGATTAGACC AGAGGATATA 
AAATACTATG AGGAGATAGG GATAAATAGA TTTAAAATTG CAGGTAGAAA TAAAAAGACG 
GATTGGATAT TAAGAGTAGT AAAAGCTTAT GCTGAGAGGA AGTACGAAGG AGATCTCTTA 
GATCTCGTTA GCTATCCTCA AGGGAGAGCA GCTACTAAGG CAGTTCAGAT GGTTAATGGA 
CCTTCATCCT ACTTTATACT GACTTCGGTA AGGATAGATA ATACTAAGTT CCCTAAGGGA 
TGGATAAAGT TCTTTTTCAC TAACGATTGT GATACGAGAA GCTGTAAGGA ATGTAAATAT 
TGCGATATCG TAGCTGAAAG AGTAATGACT GTAAATGGAG AACCGTTTAA GAGCAGTGAA 
TGGAGCATAA GGCAACCTTA TCCGATCAAT ATAATACCGA AATTTAAAGA AAGAAAATAA

Protein sequence

MKLVVATNFD DSLLEGLKRY PDVKYIFGSF KRTITGHGRA GFIVPHIKEE QFETHISLAH 
SYGIKFLYTM NTNTLLGKEY DTEFIGKVMK EVDKLVNFGV DGFIVALPFL IRLIRTEYPD 
LEVSASSFSR IRNVREVEEY TNLGVNTIIM HEDANRDFKL LKEVAALSRA NRFEIELILN 
NSCLYGCPFR LTHDNISSVT SMVNGVNDVW FEYPVLLCAT DVLNDPANLI RSRWIRPEDI 
KYYEEIGINR FKIAGRNKKT DWILRVVKAY AERKYEGDLL DLVSYPQGRA ATKAVQMVNG 
PSSYFILTSV RIDNTKFPKG WIKFFFTNDC DTRSCKECKY CDIVAERVMT VNGEPFKSSE 
WSIRQPYPIN IIPKFKERK