Gene Ssol_1993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1993
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1787629
End bp	1788804
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	37%
IMG OID
Product	formate hydrogenlyase subunit 5 (HycE)
Protein accession	ACX92203
Protein GI	261602600
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATACT ATAAATGGAC TCAAAAAGGC GAGGGAAGGA AAATAGGCAA AATAGGGGAT 
TATTGTCTCT ACGAAAAAAC GATAACAGAA GAGAAATGTG AGGAAAACAA ACCAAATATA 
ACACAAACGT ATGGATCATT CAAGTTCATT TACGGACCCT CAGCTGGAGG ACTACTCGAA 
ACAATAAAAT TCATTATTAC AACTAATGGT GAAAAAATTC TAGGAATAGA CGCTGAGGTA 
TACAAGAACA GAGAAATAGT AATAAGCGGT TTAACTGTGG ACGATGCCTT ACTCAGAGTA 
GAGAGAATAA ACGCTCCATT TAGTGCTTCC CACACAATAT CCTTTTTACT CGCTGTAGAA 
GATTCGTTAG AATTAGAACA AGACTATCCA ACCCAACTAA AGAGAATAGC CGAAATAGAA 
TTGGAAAGAA TAAGAAATCA CTTATTCGTA ATATCGAGAT TAACTGAAAC CACATCACTA 
AACGTACCTA CATACCATCT CTTGCACCTC GTTGAAAAAG TCAACAGATT AATAGGCAAA 
ATGTGTGGTC ACAGGTATTT CTTTGGCGTT AATGCAATTA ACGGGGTTAA CTGCGATTTC 
GGAAATTTAT TAAGAATAAT AGATATTACC AAGGAATTTA AACAAATCTT CGATGGGCTA 
CTTGAAAGTA GAATCTTCAT AGATAGACTC CAAGAAAACG GAAAAATAAT AGATGAAAAC 
AGTATAGGAC CAGCTGCAAG AGCTGCTGGA CTCGCTTACG ATGCGAGAAA GGACTTTAAA 
GCCTTACCTT ATGAAGACTT AGGTTTTAGA ACAGTTATCA CACAAGAGGC AGACTCATTC 
GGAAGGTTCC TAGTTAGGGG AATGGAGATA ATCGAGTCGG CCAAAATTTT AGTAGAGTTA 
CACGATGAAA TAAAGAACAG CAATAACGAG AGAGGGAAAA ATCACAAACA AGGAGGGGGA 
GAGGGACTAG CCAGAGTCGA GAGTCCATCT GGTGATCTAG CCTATTACGT CAAGTTAAAT 
AACGGGATTA TCGACTCAGT ATCACTTCTC ACTCCTTCAC AAGTCAATCT CAACCTATTT 
TTGAAAAGCG TGATAAACAC AATATTTACC GATTTTCAAT TCAATTGGGA AAGTTTTGGA 
ATTTGGGTAA GTGAAATAGG AGTGATGTTA AAGTGA

Protein sequence

MKYYKWTQKG EGRKIGKIGD YCLYEKTITE EKCEENKPNI TQTYGSFKFI YGPSAGGLLE 
TIKFIITTNG EKILGIDAEV YKNREIVISG LTVDDALLRV ERINAPFSAS HTISFLLAVE 
DSLELEQDYP TQLKRIAEIE LERIRNHLFV ISRLTETTSL NVPTYHLLHL VEKVNRLIGK 
MCGHRYFFGV NAINGVNCDF GNLLRIIDIT KEFKQIFDGL LESRIFIDRL QENGKIIDEN 
SIGPAARAAG LAYDARKDFK ALPYEDLGFR TVITQEADSF GRFLVRGMEI IESAKILVEL 
HDEIKNSNNE RGKNHKQGGG EGLARVESPS GDLAYYVKLN NGIIDSVSLL TPSQVNLNLF 
LKSVINTIFT DFQFNWESFG IWVSEIGVML K