Gene Ssol_1000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1000
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	940131
End bp	941525
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	37%
IMG OID
Product	exsB protein
Protein accession	ACX91244
Protein GI	261601641
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTGCAGTG TATCTGGAGT CCTCATATTA AACCCTAAAA ATTTTGAGAA AGTTGAGCTG 
AAATTAGCTA GTATCCTCAA AAAGGCAGAA GATAGGGGTA GGGACAGTTT TGGTATTGTT 
GTAATTCAAA AGGATGGTAC AGTAAAAGTA AGAAAATCCA TAGGAAAGCC CTCAGAAAAA 
GAGGAATTAC TATACGGCAT TTTAGATGAA GACTCTAGGG TTGTCATAGC TAATAATAGG 
GCAGAACCCA CTACTGAATA CGTTAGACAG AAAACTGAGG ACGACATTCA ACCTTTTATT 
GGAGACAGAT ATATTGTAAC TCATAATGGA ATAATCGCAA ATGATTTAGA ATTAGAGAAA 
AAATATGAAT TAAAAAGAAA AACTAAGATA GATAGTGCAA TTCTTCCACT ACTTTTGGAC 
AAGACGTGGG ACGGTAATCT TGAAGCACTA AAGGGAATAT TAGAGCAAAT CAAAGGAAGT 
TTTGCTTTGG TTATAGGAGA TAAGAAAAAC CCTGATAGAA TATTTCTAGC TCAGAACTTT 
AAGCCATTAT ACATGGCTTA TGACCACTCG TTGGAGTCCC TATTCTTTAC ATCTCTTGAC 
GAATATTTTG ATGCAAAACC ATTCGACCCA GTAAATATAA CTAAATTGGA ACCATATTCG 
GTAGTAATGG TCACTTCGAA TAAACTAATA ACTACGTTGC CTATCATGGA AAAAAGAAAG 
AAGTATAGGG TACTTGTTGT GGCAAGTGGT GGGTTAGATT CCACTGTAGC AGCAACTAAA 
CTTCTAAGAG AAGGTCATGA AGTTACTCTA ATACACTTTA ATTACCACCA TAAGGCTGAG 
GAAAAGGAAA GAGAGGCCGT GAGGAAAATT GCCGAATATT TGCAAATACC ACTGCTTGAA 
ATAAATACAG ATTTATTCAA AATAATAGGT CATGCCACGT TAATAAAGGG AGGAGGAGAG 
ATAGTTAAGG ATAGGAAAGG AGAAGAAGGA GCAGAGTTTG CACATGAATG GGTTCCTGCA 
AGAAATCTAA TTTTCTTCTC TGTTTCATTA GCAATTGCCG AAGCCTATGG ATATGATGCC 
ATAGCATCTG GAATAAATTT AGAGGAAGCT GGAGCTTATC CAGATAACGA GATGGAATTC 
ATAAGGATGT TAAATAAGTT AAGCCCATAT GCAACTGGTC CAAACAAGAG AATTGAGATA 
TTAATGCCAG TTGGTAATTT AGTAAAGCAC GAAATAGTAA AGCTGGGATA CGAAATTGGT 
GCCCCACTAC ATTTGACCTG GAGCTGTTAT GAAGGTGGGC AAAAACATTG TGGGAAATGT 
GGGCCTTGTT ATATGAGGAA GATGGCGTTT AGGATCAATG GACTTAAAGA TCCAGTTGAA 
TATGATGAAG AGTGA

Protein sequence

MCSVSGVLIL NPKNFEKVEL KLASILKKAE DRGRDSFGIV VIQKDGTVKV RKSIGKPSEK 
EELLYGILDE DSRVVIANNR AEPTTEYVRQ KTEDDIQPFI GDRYIVTHNG IIANDLELEK 
KYELKRKTKI DSAILPLLLD KTWDGNLEAL KGILEQIKGS FALVIGDKKN PDRIFLAQNF 
KPLYMAYDHS LESLFFTSLD EYFDAKPFDP VNITKLEPYS VVMVTSNKLI TTLPIMEKRK 
KYRVLVVASG GLDSTVAATK LLREGHEVTL IHFNYHHKAE EKEREAVRKI AEYLQIPLLE 
INTDLFKIIG HATLIKGGGE IVKDRKGEEG AEFAHEWVPA RNLIFFSVSL AIAEAYGYDA 
IASGINLEEA GAYPDNEMEF IRMLNKLSPY ATGPNKRIEI LMPVGNLVKH EIVKLGYEIG 
APLHLTWSCY EGGQKHCGKC GPCYMRKMAF RINGLKDPVE YDEE