Gene Ssol_0531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0531
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	476498
End bp	477703
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	38%
IMG OID
Product	amidase, hydantoinase/carbamoylase family
Protein accession	ACX90810
Protein GI	261601207
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCAG AAAGGTTTTT GACAACTTTC CATTCGTTAA CTAATATAGG TTGGACTGAG 
GACGGAGTAC TGAGGCTTGC TTTAAATGAA TATGATATAA AAGTAAGAGA GGAACTAATA 
AAAATTCTAT CGAGTATAGG TGTTCACATA ATGGTCGATG ATGCCGGAAA TATAATTGGA 
GAATTAGGTG GTAAACTAAG TGATGCTATT GCGATTGGAT CACATATGGA TTCCGTGCCT 
TATGGAGGAA AATACGACGG TTTTTATGGC GTTATGGCGG GACTTGAAGT ATTACGAAGT 
ATTAAAGAGA GAGGCATATC TAATCATTCT ATTAAACTTA TAGATTTTAC GAATGAAGAG 
GGTTCTAGAT TTCAACCCTC ACTTCTAGGC TCGGGATTAA CCACAGGTAT CTTCGATAAA 
AACTACGTCT ACTCAAGGAG AGATAAGGAT AATATAAGTT TTGAGGAAGC GTTAAGGGTT 
TCCGGATTTA TGGGAGATGA AAGCAATAGA CTAATGCATA TGAAGCCTAA CTACTATCTA 
GAGCTTCACA TAGAACAAGG TCCAATTTTA GAGGAAGAGG GGTATCAAAT TGGAATACCT 
TTAGGAATTG CTGGTTTAAG CGTATATGAA TTCACATTTA AGGGTCAGTC TAGTCAAACC 
GGACCTACAC CAATGGATAG GAGAAGGGAT GCCCTAGTAG GCGCATCTAA ATTCGTAGTT 
AGCGTTAGGG ATCACGCAAA GAAGCAGGAA AACTTAAGGG CCACTGTTGG TATACTTAAT 
GTTAAACCAA ATGTATACAA CGCTATACCT AGGGAAGTCA GACTCACTGT TGACGTTAGG 
AGTATTGAGA GGAATAGAAT AGATCACACT ATAAATGAAT TTGTTAATAT TGCAAAAAGT 
ATTGCCGACG ACGAGAAACT AGAAGTTGAA TATAGGCATC TGTGGACAGC TAATCCTGTG 
AGTTTTTCCG ACGAAGTCAT TAGTGTTATA GAAAGAGCGT GTAAAGAGTT AAGCATGAGA 
TATAAGTTTA TGTATAGTTG GGCAGGGCAT GATGCACAGT ATATGACGAA GATTTCTAAA 
GTCGGCATGA TATTTATTCC ATCTCATTTA GGCATTAGTC ACGCAAAGGA AGAATACTCC 
TCAGATGAGG ATATGTTAAA CGGGCTAAGA GTACTAGAGA AAGCTGTAGA ACTTTTAAAC 
AGTTGA

Protein sequence

MNPERFLTTF HSLTNIGWTE DGVLRLALNE YDIKVREELI KILSSIGVHI MVDDAGNIIG 
ELGGKLSDAI AIGSHMDSVP YGGKYDGFYG VMAGLEVLRS IKERGISNHS IKLIDFTNEE 
GSRFQPSLLG SGLTTGIFDK NYVYSRRDKD NISFEEALRV SGFMGDESNR LMHMKPNYYL 
ELHIEQGPIL EEEGYQIGIP LGIAGLSVYE FTFKGQSSQT GPTPMDRRRD ALVGASKFVV 
SVRDHAKKQE NLRATVGILN VKPNVYNAIP REVRLTVDVR SIERNRIDHT INEFVNIAKS 
IADDEKLEVE YRHLWTANPV SFSDEVISVI ERACKELSMR YKFMYSWAGH DAQYMTKISK 
VGMIFIPSHL GISHAKEEYS SDEDMLNGLR VLEKAVELLN S