Gene Ssol_0507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0507
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	452567
End bp	454342
Gene Length	1776 bp
Protein Length	591 aa
Translation table	11
GC content	37%
IMG OID
Product	Acylaminoacyl-peptidase
Protein accession	ACX90786
Protein GI	261601183
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACCAG AAGACTACTA CTATTCGATT AAATTAGTAC CAGAAATAAC AATAGAGAAT 
GGAAAACTAT TTCACGTAGA GACATGGATA GAAGAGGATA AATACAAATC ATCAATTTAT 
TTGAACCTCA AGAGGATAAC TTTTCAAGGA AATGAATCAT CACCTAAGTT CAATAATGAT 
AAGCTTTACT TTATAAGAAA CGAAGAGGCT AAATCATCCT TACTTGAAGC ACAACTCTAT 
GGCGAGCCTA AAGTAATATT TACATTTTCT GGCAAAATAT CCAAATATGA GTTCCATAAT 
AAGGGAATAT TAGTGATAGC AGAGGAAAAC ACAGATAAGA CATTACCTTT TAGAGCCGAG 
AAGATAAAGT ATAGGTTTGA TAGCAGAGGT TTATTGAGAG CTAGGCAATC ACTTTACCTA 
TTTGATGGTA AGGATCTGAG AAGGCTCGTT ACAGGGAACT TTGACGTTAC AGATTTAGCT 
ACAAACGGTA ATAGGGTCGT AATTTCAGCA ACTAAGGACG GAGATGATTA TGGATTAGGA 
AATTTGTATG AGGTAAATAT AGAAACTGGG GAGTTAAACA GAATAACGAA GGAGGATGGG 
ACTGTACAAG CAATAGCTAT GAATAGCGAG GGGAAAATAG CGTTTTTAGG GCATAGGAAA 
GGGCTAACCC CATGGGCTTC TCTCGAAATA ATGCTACCAG AAGAAGGAAA GAGTTACATG 
TGTGGAAAGA CTTGCGGAAA TAAAGTGTTA ACTGATTTAT TTGATGGCGT AAAGGATAGG 
ATCGTATTCG AAAAAGATCT AATACTCTCC TTAGGTCAAG AGGGAGGTAC GTCACATATT 
TATCAAATCT CTGATAATAA GGTAGATAAG GTAACTAGTG GAAATATAAT GGTAAGAGGA 
TTTGATTATA GTAATAGTGA ACTAGCTTAC TTCTATTCCA CTCCAGAAAA GCCTGTAATA 
TTAAAATATA GAGATATAGA ATATGATCCG AACCCTAACA TCAAAGGATA CACTCCAGAG 
AGAATAACAG TAAACTCTAA CGGAGTAGAA GTGGAGGGAT GGAGTATAAT TAAAGATCCT 
AACGCACCAA CAATATTATT CATCCATGGG GGACCGCATA TGGCGTATGG TTATGGTTAT 
TTCATAGAAT TCCAGTTCTT CGTAGATAAT GGGTTTAACG TAATATATGC AAATCCTAGA 
GGCAGTCAAG GATATGGGGA GGAATTCGCC AAGGCTTGTG TGGGGGATTG GGGTGGAAAG 
GATTTCGAAG ATCTAATGAA CTTCGTGAAT ACCGTTAAGG AAAGGTATAG TTTAAAAGGT 
AAATTCGGTA TTACTGGTGG TTCTTATGGA GGCTTTATGA CCAATTGGAT AGTAACGAAG 
ACTAGTATGT TTTCGGCTGC AATTAGCGAA AGGAGTATAT CGAATCTAGT TAGTATGTGT 
GGTACTAGTG ATATAGGTTT TTGGTTTAAT GCGATTGAAT CCGGGATTGC AGATCCATGG 
AGTACTGAAG GCATTGAGAA ACTAATGAAA ATGTCGCCAA TTTATTATGT GAAAAACGTT 
AAAACACCTA CCATGTTAAT TCACGGAGAG GAAGATTATA GATGCCCAAT TGAACAAGCT 
GAACAATTTT ATGTTGCATT GAAGATGCAA GGAGTCCCTA CAACGTTGGT AAGATACCAA 
GGTGATAGTC ATGAACACGC TAGAAGAGGG AAGCCTAAGA ATATGATAGA TAGATTGAAG 
ACTAAATTAG AATGGTTTAG TAAATATTTA CTCTAA

Protein sequence

MKPEDYYYSI KLVPEITIEN GKLFHVETWI EEDKYKSSIY LNLKRITFQG NESSPKFNND 
KLYFIRNEEA KSSLLEAQLY GEPKVIFTFS GKISKYEFHN KGILVIAEEN TDKTLPFRAE 
KIKYRFDSRG LLRARQSLYL FDGKDLRRLV TGNFDVTDLA TNGNRVVISA TKDGDDYGLG 
NLYEVNIETG ELNRITKEDG TVQAIAMNSE GKIAFLGHRK GLTPWASLEI MLPEEGKSYM 
CGKTCGNKVL TDLFDGVKDR IVFEKDLILS LGQEGGTSHI YQISDNKVDK VTSGNIMVRG 
FDYSNSELAY FYSTPEKPVI LKYRDIEYDP NPNIKGYTPE RITVNSNGVE VEGWSIIKDP 
NAPTILFIHG GPHMAYGYGY FIEFQFFVDN GFNVIYANPR GSQGYGEEFA KACVGDWGGK 
DFEDLMNFVN TVKERYSLKG KFGITGGSYG GFMTNWIVTK TSMFSAAISE RSISNLVSMC 
GTSDIGFWFN AIESGIADPW STEGIEKLMK MSPIYYVKNV KTPTMLIHGE EDYRCPIEQA 
EQFYVALKMQ GVPTTLVRYQ GDSHEHARRG KPKNMIDRLK TKLEWFSKYL L