Gene Ssol_0920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0920
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	860147
End bp	861562
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	37%
IMG OID
Product	General substrate transporter
Protein accession	ACX91165
Protein GI	261601562
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAAG GAATTTCAAA AACACCCTTT GGATCTATAG ATTCGTTGAA GTTAACTTTC 
AATCATATAA AAGTCTGGTA TACTTCAGGT ATGGGATTTT TTACTGATGC CTATGATTTA 
TTCATAATAA GTGCGATTCT AGATGTTTTA TTACAGTTAC ATGACCCTAA TTTCCCACTT 
AATAGCGTAA CAGAAGGTCT TTTAGCGTCT TCAGCATTAT GGGCTGCAAT AATCGGGCAA 
TTAGTATTTG GTTTTCTAGG TGACAAAATA GGAAGGAAGG CAATATATGG GGTTGAGGCA 
ATTTTAATGA CAGTAGGTGC TTTACTCTCC GCACTCTCTC CTAATATATA TTGGCTTATA 
ATTTTCAGAT CAATTATGGG TTTAGGGATA GGTGGGGATT ATCCAATCTC TGCCACCATA 
ATGAGTGAAT ACGCTAATGT TAAAGATAGG GGTAAGCTGA TAGCTTTAGT TTTTGCAAAT 
CAAGGATTAG GTTCTTTAGC TGCAGTTTCA GTTGGTATTG GTTCTGTTCT AGCGTTTCCC 
TTAGATATTT CTTGGAGAGT AATGGCAGCC ATAGGTGCAA TACCGGCTGC GACTGTAATC 
TACCTTAGAA GAAAAACACC AGAAACTCCT AGATATTCAA TGTTGGTGAA AGGTAATGTT 
CAAGAGGCTA AGAAAGCTGC TGAGTTCCTG GGTGCAAAAA TTGAAGAAAA GAGAGCTTAT 
TCGAAACCAT TATCATTGTC AGAATTCCTC TCCAAGTATT GGTTAATACT TATTGGAACT 
GCGGTTCCGT GGTTTATTCT CGATATAGCT TTCTATGGAA CTGGTATATA CTCTGGTGCA 
ATAACTCAAT TGATATTAGG AAAACCTACT AGTATAGCAA ATTTAATATT GGAACAAGGT 
TTACCATATA TGGTAGGATT TTTCGGTTAC TTTACTGCAG TAGCATTAAT GGACAAATTA 
GGGAGAAAAA TCATACAGTT GCAAGGTTTT ATATTAATGA CTATAATTTA CGCAGTTGTT 
TCTTCGTTCC TAATAGTTAG TGGAACTAAA GTAGTTGGTT TGACAATTCC AGCTGGAATT 
GGATTCTTGA TATATGCACT ATCATTCTTC TTCATAGACT TTGGTCCTAA TACTACGACT 
TTTATACTGC CAGCTGAAGC TTATCCAACT AGGGCTAGAA CTACTGGCCA TGGAATTAGT 
GCGGCTTCAG GCAAATTAGG GGCAGCAATA ACTACTTACC TATTCCCTTC ACTTTTAGCC 
TCAATGGGAA TAAAGAATAT TTTACTAATG CTTTCTGCGC TATCACTAGT AGGCGCAATT 
GTGACAATAA TAGCTGTTAA AGAAACTAAG GGCAAAAGTT TAGAGGAAAT AAGCAAGGAA 
GAGGTAATTG TTCAAGAAGA ACAATTCTCG ACATAA

Protein sequence

MDKGISKTPF GSIDSLKLTF NHIKVWYTSG MGFFTDAYDL FIISAILDVL LQLHDPNFPL 
NSVTEGLLAS SALWAAIIGQ LVFGFLGDKI GRKAIYGVEA ILMTVGALLS ALSPNIYWLI 
IFRSIMGLGI GGDYPISATI MSEYANVKDR GKLIALVFAN QGLGSLAAVS VGIGSVLAFP 
LDISWRVMAA IGAIPAATVI YLRRKTPETP RYSMLVKGNV QEAKKAAEFL GAKIEEKRAY 
SKPLSLSEFL SKYWLILIGT AVPWFILDIA FYGTGIYSGA ITQLILGKPT SIANLILEQG 
LPYMVGFFGY FTAVALMDKL GRKIIQLQGF ILMTIIYAVV SSFLIVSGTK VVGLTIPAGI 
GFLIYALSFF FIDFGPNTTT FILPAEAYPT RARTTGHGIS AASGKLGAAI TTYLFPSLLA 
SMGIKNILLM LSALSLVGAI VTIIAVKETK GKSLEEISKE EVIVQEEQFS T