Gene Ssol_2792 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2792
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	2554088
End bp	2555188
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	32%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	ACX92875
Protein GI	261603272
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAATA GACAGTTTAT TTTGTTTACA ATATTAGTCT TTTTTACAGG ATTATATCTA 
GGAACTCTAA GAATAATTAT TCCGGTATTT GAGAAACAAA TAAACATCTC AATAATGTTA 
AGCCTATTAT TACCCTTGGT ATCCTTTGGG TTTGTAAAAG GCGCATTTAA CTTCATTGCG 
GGAAAGCTCT CTGATGACTT GGGAAGAAAG AGAGTACTCG TAATAGGCTG GTTAGTGGCG 
TTGATTTCAG TCCCTTTATT TCTCTCAATT AACATATATA CAGTCATCAT TATTTCGATT 
CTGCTTGCAA TAAATCAAGC TTTGACGTGG ACTACTACCG TCACTTCACA AATAGACATT 
AGCGGTAAAT TAAGAGCAGG CTTCGCTACT GGAATAAATG AAATGTCGGG ATATTTGGGA 
GTCTCTTTTG GAAGTCTCTT CGCTAGTTAT TTATTTAAGC TAAGTAGTAT TTTCATCGGA 
ATAATTTGCT TGATAGCATT AATTTCTTCC TTTAACGTAA TTGAGACTAA AACATTAATA 
CCAAATGCCA CTTTATCGAA AAAGGAAAAT AATCATATAA ATTACTTTTC CATTACTAAA 
ATAAGCATTG CAGGACTCCT AGAGAAGTTT GTAGATTCAG CATTCTTTAT CTTGATACCC 
ACATTTCTAT TATTACAACA TTATACGTTA TTTTTGATAG GAATAACTGT ATCTAGCTAT 
ACGTTTACTT GGTCACTTTC GCAACCACTA TTCGGGTACT TGGCAGATAC TTACAACAAA 
AGAAGACTAA TACTTGTAAT AGGTTTTTTA TTAATGTTTG TTGGCTTTAT AAAATATTCT 
GAACTTCCGA TTTTATTTTC AATAATAGAA GGTATTGGTA TGGGCATGAT CTATCCTAAT 
TTAATAGCTT TTGTTAACGA TAAGATTAAC GAGAGTGTAA GAGGAAAAGC ATTAGGCTAT 
TACAGGTTAT ATAGGGATAG TGGATATGGT GTGGCTGGCT TACTACTACC ATTACTTTAC 
TCGTTTTATG GATACGAATA TACTTTATTG ATAGTAGGAA TATTGCAAGT TGTAGCTCTC 
TTACTAGTAG TAAGATCTTA A

Protein sequence

MMNRQFILFT ILVFFTGLYL GTLRIIIPVF EKQINISIML SLLLPLVSFG FVKGAFNFIA 
GKLSDDLGRK RVLVIGWLVA LISVPLFLSI NIYTVIIISI LLAINQALTW TTTVTSQIDI 
SGKLRAGFAT GINEMSGYLG VSFGSLFASY LFKLSSIFIG IICLIALISS FNVIETKTLI 
PNATLSKKEN NHINYFSITK ISIAGLLEKF VDSAFFILIP TFLLLQHYTL FLIGITVSSY 
TFTWSLSQPL FGYLADTYNK RRLILVIGFL LMFVGFIKYS ELPILFSIIE GIGMGMIYPN 
LIAFVNDKIN ESVRGKALGY YRLYRDSGYG VAGLLLPLLY SFYGYEYTLL IVGILQVVAL 
LLVVRS