Gene Ssol_1701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1701
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1525781
End bp	1527115
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	33%
IMG OID
Product	argininosuccinate lyase
Protein accession	ACX91918
Protein GI	261602315
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.273814
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTATATA GAAAATGGGG ATCTGAAAAA GACGAAGTAG TTAACTATAC CTCATCCGTG 
GATAGCGATA GAGAGATTAT TGAAGAAGTG AAATTAACTA TGAAGGCACA CGTAATTAGT 
CTTTATTTGA CTGGATACCT TGGGAAGGAA ACCGCTAGAA AGATCCTTGT TGCATTAAAC 
GAGTTTAAAG AAATTGGCCA AGGATATGAG GATATTCATG AAGCATTAGA GGATTTCTTA 
ATAAAGAAAG TAGGGGAGGA TGCCGGATGG ATAGGGTTAG GTAGGAGTAG AAATGATCAC 
GTTGCCACAG CTTTAAGACT GAGATTAAGA AATAAGCTAA TAGAACTTTT AACTGACATT 
AATAGCTTGA GAAAAATACT ATTGGATAAA GCAAAAGAGC ATATAACAAC AATATTTCCC 
TCATATACAC ATTTACAATT AGCACAACCC ACAACATTTG CCCACTACCT AACTTACATT 
GAAGAGGAGT TAGCTTCGAG GTGGGAAATA ATATTTTCCA CGTTAAAACA AGTTAATAAA 
TCGCCATTAG GCTCTGGAGC AATAGTAGGG ACAAACGTTA AGATTGATAG AGAAAAAGAA 
GCCGAACTAT TAGGATTTGA CAGTATAATA TACAATACAT TATCAGCTAC TTCATCGAGA 
GCGGATATTC TCAGCACGAT CTCGGAATTA ACTGTATTAA TGGTAGTACT AAGCAGAATA 
GCTGAGGATT TAATTTTCTT TTCGTCAAAT AAATTAATTA AATTACCAGA CTCTCATGTT 
AGCACTAGCA GTTTGATGCC CCAAAAGAGA AATCCAGTTA CAATGGAGAT ACTACGAGCA 
AAGGCAGCGG AGTCTATAGG TATGCTAACT AGTTTGCTTT CCATTTACAA AGGTTTACCT 
ACTGGATACA ATCTTGATTT ACAAGAGATG AATAAATATT ATTGGCTTGT AATAAACTAT 
ACTAAATCTT CAATAGGAGT TTTAAGCTCA CTCTTTAGTC AAATACAAGT AAATAAAATA 
AACATTGATG AATCTAGTTT GGCCACTGAT GACGCTGAAT TACTTTCCAT AAGTAAGAAA 
GTACCTTATA GATCGACCTA CTTTGAGATA GCTAAAAAAG TTAGGGAAGG TTCTTATAAG 
TCAACTTTAA AAATAGAGGA TTCTATTAAT ATGAAGGCAG TAATCGGGTC TCCTAATTTT 
GATTTAATGG CTAATTTGAT AAAAATTAGA GAAACTAAAT TGAAAGAAGA TGAAAAGGAA 
ATCGAGGAGT ATAAGTTAAA AATAATCTCC AAATTAGGAG AATTACAAGT GATCGAAAAT 
GAAATTGGAG AATAA

Protein sequence

MLYRKWGSEK DEVVNYTSSV DSDREIIEEV KLTMKAHVIS LYLTGYLGKE TARKILVALN 
EFKEIGQGYE DIHEALEDFL IKKVGEDAGW IGLGRSRNDH VATALRLRLR NKLIELLTDI 
NSLRKILLDK AKEHITTIFP SYTHLQLAQP TTFAHYLTYI EEELASRWEI IFSTLKQVNK 
SPLGSGAIVG TNVKIDREKE AELLGFDSII YNTLSATSSR ADILSTISEL TVLMVVLSRI 
AEDLIFFSSN KLIKLPDSHV STSSLMPQKR NPVTMEILRA KAAESIGMLT SLLSIYKGLP 
TGYNLDLQEM NKYYWLVINY TKSSIGVLSS LFSQIQVNKI NIDESSLATD DAELLSISKK 
VPYRSTYFEI AKKVREGSYK STLKIEDSIN MKAVIGSPNF DLMANLIKIR ETKLKEDEKE 
IEEYKLKIIS KLGELQVIEN EIGE