Gene Ssol_1970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1970
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1757293
End bp	1758483
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	37%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	ACX92181
Protein GI	261602578
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCA GAATACTAAC CTTAACTTCA TTATCCCACT TTATAAACGA CGGAAATAGC 
TGGGTCCTTC CAGTGACGTT CACATTCCTA ATAACGTATC TTGGTATATC AAAATTCCTA 
ATCGGAATAC TATCTGGCGC ATTTTTCTTC GGAATATCAG CATTAGCTTC GCCTTTAGTC 
TCCAAGATAG CAGACAAGTT TACCAATTAT TCCAGCATAA TGGGAATAGG AATATTACTA 
TGGGGAATTG GATTAATATC ATTCGGTTAC TCAATACAAC TCCACTTTTT GCCATTAGTA 
TTCATTTCAG TGGCAATAGC TGGTTTTGCA TCAGCATTCT ATCACCCAAT AGGTGCGGCT 
GTTCTATCAA TAACATACAA GGGAAATGCT GGTATTGCAT TAGGCATAAA CGGGTCAATG 
GGTAGCCTTG GCAGGGCAAT TTACTCAACA TTAACCCTTT CACTATTTGC AATATTGAAT 
AAGGATATGA CCTTAGATAT GTTAATAATA GGTATAATAT CAATAATAGC TGCATTGCCA 
TCAATATTCC TAAAGATTTC TATCACGAAA GAGGAGGATC ATAAAACACC TTCCTCTTCC 
AATACCACTA GTACCAGAGG CACATTATTT GTAGTAATCT TATTGACTAT CATTGCATTA 
CTACGAAGTA TATTTGGTCA AGGAATTTCA CAATTCCTTC CAACATTATT AGTAGAAAAT 
TATGGTTATT CTTACAACGT TAACTTAGGT GAAGCAATTA CAATCGCTCT AGCAGCAGCT 
ATAGTAGGGC AACCAATACT AGGATTCCTA TCAGATAGAG TAGGGAGAAG GCTAATTTAC 
GCTATATCGA CCTTTGGTGC TGCCTTAACA TTACTTTTGT TTCTAAAAAT ACCAAACATA 
GCCTTGCTAT CATTATTTGG ATTTTTTAAC TTCAGCGCAT TCCCACTAAT GCTATCAATA 
GTAGGAGATT TTGTACCTAG AAATTCAGCG AGTTTTGCCA ATTCACTAGT TTGGGGATTA 
GGAGTTACTG GTGGTGGAGT TATTGGTCCA ATAGTAGTGG GAGCAGTATC CCAAGTTTCA 
AACTTAGTGT TCGCAAGTGA AATAGTAACC ATAATGGCTT TCGTCGCAGG AGCGTTAACA 
GCATTAATTC CTAAACCACC AAAGAGAACC AAAGTACCAT TATTTGGATA A

Protein sequence

MKIRILTLTS LSHFINDGNS WVLPVTFTFL ITYLGISKFL IGILSGAFFF GISALASPLV 
SKIADKFTNY SSIMGIGILL WGIGLISFGY SIQLHFLPLV FISVAIAGFA SAFYHPIGAA 
VLSITYKGNA GIALGINGSM GSLGRAIYST LTLSLFAILN KDMTLDMLII GIISIIAALP 
SIFLKISITK EEDHKTPSSS NTTSTRGTLF VVILLTIIAL LRSIFGQGIS QFLPTLLVEN 
YGYSYNVNLG EAITIALAAA IVGQPILGFL SDRVGRRLIY AISTFGAALT LLLFLKIPNI 
ALLSLFGFFN FSAFPLMLSI VGDFVPRNSA SFANSLVWGL GVTGGGVIGP IVVGAVSQVS 
NLVFASEIVT IMAFVAGALT ALIPKPPKRT KVPLFG