Gene Ssol_0663 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0663
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	612431
End bp	613831
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	40%
IMG OID
Product	selenium-binding protein
Protein accession	ACX90933
Protein GI	261601330
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.151689
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATTAC CGTCAGTTTT TGCTCCCTTT AAGAGAGATC CAACGTTTTA TCCATCTCCA 
AAGATGGCCA TGAAATCACC TCCAGAGGAC TTAGCTTATG TTGCTTGCTT ATACACTGGA 
ACTGGAATAA ATAGGCCAGA TTTCATAGCA GTAGTTGATG TAAAGCCTGA ATCGGAAACT 
TATTCTAAGG TAATCCATAA GGTTGAATTA TCATATGTCA ATGATGAGCT GCACCATTTT 
GGTTGGAATG CTTGTAGTTC CGCCTTATGC CCTAATGGAA GACCAAATTT TGAGAGAAGA 
TTCTTAGTTG TACCCGGTTT ACGTTCCTCA AGGATTTATA TAGTAGATAC AAAATTAAAC 
CCTAGACAGC CTAATATAGT TAAAACTATA GAACCAGAGG AGGTTAAGAA AGTAACGGGC 
TACAGTAGGC TACATACAGT ACATTGTGGG CCAGATGGTA TCTACATAAG TGCTTTTGGC 
AATGAAAACG GTGAGGGTCC AGGAGGAATT TTAATGTTAG ACCATTACAG TTTTGAACCT 
TTAGGCAAGT GGGAGATAGA TAGGAGTGAC CAATATTTGG CTTACGATTT CTGGTGGAAT 
TTACCAAATG AAGTAATGGT AACTAGTGAG TGGGCAGTGC CAAACACTAT TGAGAACGGG 
CTTCGATTGG AACATCTTAA AGATAGATAT GGAAATAGGA TACACTTCTG GGACTTGAGG 
AGAAGAAAGA AGGTATCAAG CGTAACCCTT GGTGAAGAGA ATAGGATGGC GTTAGAGCTT 
AGACCCCTAC ATGACCCAAC TAAACTCATG GGATTCATAA ATATGGTAGT AAGCCTAAAG 
GATCTGAGCA GTTCAATCTG GTTATGGTAC TACGAAGATG GTAAATGGAA TGGGGAAAAG 
GTTATTGAAA TCCCTGCGGA ACCTACTGAG GGAGGACTGC CTGAGATATT GAAACCATTT 
AAGGCTGTAC CACCATTAGT TACTGATATA GACTTAAGCC TTGATGATAA GTTCCTTTAC 
GTTAGCTTAT GGGGTATAGG AGAGATTAGG CAGTACGACG TGAGTAATCC ATTTAAACCA 
GTACTTACTG GAAAGGTAAA ATTGGGAGGT ATATTTCATA GGGCTGACCA TCCCTCAGAT 
CATAAACTTA CTGGAGCTCC TCAGATGATT GAAATCAGTA GGGACGGAAA AAGAGTTTAC 
GTTACCAATT CCCTATATAG TACTTGGGAT AATCAATTCT ATCCAGAGGG CTTAAAGGGA 
TGGATGGTTA AACTAAATGC TAATCCAGAT GGAGGTCTAG ATGTGGATAA GGAGTTCTTC 
GTGGATTTTG GAGAGGCTAG GTCGCATCAA GTTAGGTTAA GGGGAGGAGA TGCTTCCTCT 
GACTCTTATT GCTATCCTTA G

Protein sequence

MELPSVFAPF KRDPTFYPSP KMAMKSPPED LAYVACLYTG TGINRPDFIA VVDVKPESET 
YSKVIHKVEL SYVNDELHHF GWNACSSALC PNGRPNFERR FLVVPGLRSS RIYIVDTKLN 
PRQPNIVKTI EPEEVKKVTG YSRLHTVHCG PDGIYISAFG NENGEGPGGI LMLDHYSFEP 
LGKWEIDRSD QYLAYDFWWN LPNEVMVTSE WAVPNTIENG LRLEHLKDRY GNRIHFWDLR 
RRKKVSSVTL GEENRMALEL RPLHDPTKLM GFINMVVSLK DLSSSIWLWY YEDGKWNGEK 
VIEIPAEPTE GGLPEILKPF KAVPPLVTDI DLSLDDKFLY VSLWGIGEIR QYDVSNPFKP 
VLTGKVKLGG IFHRADHPSD HKLTGAPQMI EISRDGKRVY VTNSLYSTWD NQFYPEGLKG 
WMVKLNANPD GGLDVDKEFF VDFGEARSHQ VRLRGGDASS DSYCYP