Gene Ssol_2200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2200
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1980794
End bp	1981924
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	37%
IMG OID
Product	methane/phenol/toluene hydroxylase
Protein accession	ACX92392
Protein GI	261602789
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0929517
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTAGAT TAGAGGATTT GGAATGGTAT AAAAGGTATA AACAAATGTT CGGAGCATTC 
AAAAGCGGTC CAGAAGGGGA TCCGTTTTTC AGAGATTATG AGTATAGGGG ATACAAGAAA 
GTTTGGTCAA CGTGGCCAAT GTTGGAGAAA AAGTTAGGAA GAAAAAAACC ATCAGAATAC 
CAAGTAGTTA CTTATGCATT ATCATACTGG GCCGATCCAA GATCCCCTAC TTATATCTAC 
GATAAAGGGC CATTTGAACT AGGGACAGAA CACATAACCC AAAAATGGTA TAAACACTTT 
AGAGACAACT CACCGTTCAT TAAACCATTA TTCGAAAGAG GTGAATGGCA TGATTATGAA 
GACCCATACA AATTGACATA TTGGACTTAT AACTCCATGG CGGACGATAA TGAAACTTTC 
TTAGATAAGA TTTACGAGGA GATTGTAAAT ACTAAATATG ATTGGAACCT AAATGAAGAG 
GTACTGGAAT TATACAAGAA CGTTTATGAC CCATTAAGAT ACGTATTCCA TATTATGCAA 
ATGGAGTCAA TGTATCTAGC TACTATGGCT CCTACAAGTT CTATAGCTAA CGTATTTATT 
TTCATGGGAA TGGACCATTT AAGGAGAGTC CAAAGAATTT CACAAAGGGT AAAGATGCTC 
GATATTGTAT ATCCAAGTCT AGGATTTGGA AAGGAAACAA GGAAGGTATT TGAGGAGAGT 
CCAATATTTC AGCCAACAAG AGAAGTATTG GAGAAAATGT TAGTTACGTA TGATGTAGGA 
GAAGCCTTAG TAGCGTTTAA CTTAGCAGTC AAATTCGTAT TAGATGAACT GATACTCCAA 
CATCTAACTC AACCATTCAG TAAGTTAGGA GACGAGATGA TAAAGCACAT TCACTTATCG 
TTCTATAACG ATACGTTAAG ACATAGACAT CAAGCTCAAG AGCTGTTCAA ATACGCATTC 
AGTAAGGAGC CAAGTTTAAA GGATGTTATT AAACCTTGGG TGAAAGATTG GCAAGAGATG 
GGATTTAAGG CTACAGAAGG GTTTAGAGAT GTGCTTAAAG GAGAATATGA TAATGCTATA 
AGGCAGATTA GGAAGGCTCA TAGTGAATAT CTTGGAGGAA TAGGACTATG A

Protein sequence

MTRLEDLEWY KRYKQMFGAF KSGPEGDPFF RDYEYRGYKK VWSTWPMLEK KLGRKKPSEY 
QVVTYALSYW ADPRSPTYIY DKGPFELGTE HITQKWYKHF RDNSPFIKPL FERGEWHDYE 
DPYKLTYWTY NSMADDNETF LDKIYEEIVN TKYDWNLNEE VLELYKNVYD PLRYVFHIMQ 
MESMYLATMA PTSSIANVFI FMGMDHLRRV QRISQRVKML DIVYPSLGFG KETRKVFEES 
PIFQPTREVL EKMLVTYDVG EALVAFNLAV KFVLDELILQ HLTQPFSKLG DEMIKHIHLS 
FYNDTLRHRH QAQELFKYAF SKEPSLKDVI KPWVKDWQEM GFKATEGFRD VLKGEYDNAI 
RQIRKAHSEY LGGIGL