Gene Ssol_2108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2108
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1885372
End bp	1886523
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	37%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	ACX92314
Protein GI	261602711
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTAAAA ACAGAAACGA AGTCTTGAAA ATCTCCTTTT CAGCCTTTTT CGCTGATCTT 
GGATACCAGG CTGTAGTAGC CTCTTTTCCA ATAATTTTCG TATTGATCTT TAAAGCTCCA 
ATTCCCCTTT ATGGTTTTGC TGAGGCATTA AATTACGGGA TTGGTACTGT TATGGCTTAT 
GCTGGAGGTT TAGCTGGGGA TAGGTTTGGG AGAAAAAGGA TTGCTATTCT TGGAAATGTT 
CTTATTCTAT TTACTTCCCT AATAGGACTA TCTAGGGATT ACATTCAAGC CCTCATATTC 
TTCATGATAG GGTGGTGGTT TAGGAACTTT AGATCACCAC CAAGAAGGGC GATGATGGCT 
GAAGTCACAT CACCGGAAGA GAGATCTGAG GCATTTGGAA TTTTGCATTC TTTAGACATC 
GCTGGTGCGT TAATAGCAAT AATTTATCTA ACTGTATTAC TTTACCTTCG CGTTTCCATC 
TTTTTTGTTC TTTTATTCAC CTCAATACCT TTGCTTATGT CAACAATTGT TTTAACCATG 
GTAAATGCTG GGAAGAAAAG TGAGAAAGCG AAGAGAAAAG AAGCAGAAAG TAAAATAACC 
CAAAAAAGGG TCTTCTGGAC TCTTATATTA TCTACAATGT TCTTCGGATT TAGTCAGTAC 
AGCTTTGGAT TTCCTATTCT AACTACAACA GAGATTACTG GAAAGGAGTA TTTGGGAGTA 
TTATCTTATG GCATATTTCT TGGCGCTTCC TCTTTATTTG GGTACCTATT TGGTAGAATA 
AGAATGAAAG AATTTGAAAG TTTAGCATTT CTAGGATATT TAATTGGAGC ACTAGGATCT 
CTGGGGTTTG CGTATTTATC GAGTTTTGGA GTGTTTTCCC TTTATCCTCT CTCTTTCTTA 
ATGGGAACTA GTGTCGCCTC AACTGAGACT TTTGAACCTA CCATAATATC GAAGATAACT 
AAAGAAGAAG CATTTAGTAC AAGTATGGGC TACTTATCAG CAGGTAGAAG TATTGGGATA 
TTTCTTGGTA ATGTAATAAT GGGGTTCTTA TATCAAATAA GCTATACATA TGCGTATCTA 
TTCGCCGCTA TAACTTCGTT AATCTCCTTT GCACTAATCT TAAACTTGAT CATGAGACCA 
AATGCTTCTT AG

Protein sequence

MLKNRNEVLK ISFSAFFADL GYQAVVASFP IIFVLIFKAP IPLYGFAEAL NYGIGTVMAY 
AGGLAGDRFG RKRIAILGNV LILFTSLIGL SRDYIQALIF FMIGWWFRNF RSPPRRAMMA 
EVTSPEERSE AFGILHSLDI AGALIAIIYL TVLLYLRVSI FFVLLFTSIP LLMSTIVLTM 
VNAGKKSEKA KRKEAESKIT QKRVFWTLIL STMFFGFSQY SFGFPILTTT EITGKEYLGV 
LSYGIFLGAS SLFGYLFGRI RMKEFESLAF LGYLIGALGS LGFAYLSSFG VFSLYPLSFL 
MGTSVASTET FEPTIISKIT KEEAFSTSMG YLSAGRSIGI FLGNVIMGFL YQISYTYAYL 
FAAITSLISF ALILNLIMRP NAS