Gene Ssol_2838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2838
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	2599018
End bp	2600598
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	40%
IMG OID
Product	Na+/solute symporter
Protein accession	ACX92915
Protein GI	261603312
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGGTT TACACGTTTC TATCGTTTCA GTTGCTCTGT TTATAATTTT ATTTGTAATT 
TTTGTGTTTT TAGGCTTTTA TGGAAGCAGA TGGAGAAGAG GAGATCTATC GAAACTTCAC 
GAATGGGCTT TAGCGGGGAG AAGATTAGGA CCATATTTAA TGTGGTTTCT TCTCACTGCA 
GACCTATATA CTGCATATAC ATTTATTGCA GTACCTTCTC TAGTCTTAGC CAGCGGTCCA 
GTTGGATTTT TTGCAGCCTT CTACTCTGCG GTCACGCCCT TCATAGCCCT ACTCTTCATG 
CCTAGACTGT GGACAATTGC TAAGAACAGA GGGTATGTTA CAGCAGCGGA TTTCATTAAG 
GATAGATTTA ACAGTAGGAT TCTAGCAGGG CTTGTAGCTA TAACAGGGGT AGTAGCTGAA 
TTGCCTTACA TAGCATTACA AATAGTAGGT ATGCAAGTAG CATTACTCAT ATTATTGCTA 
GGATTGGGAG TTAGTAACAT TACATTGGCA AGTGATTTAA GTCTTTTAGT AGCCTTCATA 
ATCTTAGCTG CATTCGTATT CACAAGTGGA CTAAGGGGAG CTGCGCTAAC TGCAGTATAT 
AAGGACATCA TAATTTTAGG TACAATAATA AGTATTGCGA TCTACGTTCC ACTGGCCTTT 
GGAGGATTTT CTGGTGCATT TCATAATGCC CAAACGTTAA GCTCCCAGAT TAACTTAGCG 
TTAAATAACG TTAATAAGCC AATTTTCTAC AACTATTTAC CTAACACCCT AGCTGCGCGA 
ACTGCTTATA TTTCTTTAGC TATCGGGAGC GCATTTGCCC TCTATCTATA TCCCCACGCG 
GTTAATGCAA GCGTGAGTTC AGATTCTAAG AAATCCCTTA AATTATCACT AGCATTACAA 
CCCTTCTATT CTATCATATT AGCTGTTATA GCCTTGTTTG GAATTCTAGT CTACGCTAAT 
TCTAAAGTGG TTAATTTTAT TGCTAAAACA CACTCCGGTG CAGTAGCTGT CCCTGCTCTA 
ATAGGCTATT CAATGCCAGA TTGGTTTGTT GGGATAGCAT TGTTAGGAAT TTTCATAGGG 
GGATTAGTCC CCGCAGCTAT AATGGCAATT GGAGCAGCTA ATTTACTCAC AAGGAACATA 
ATAAAGGAGT TTAAACCTAA TATGTCTCCT AGTACTGAAT CAGCCTTAGC TAAATGGATA 
TCTACCGCGT TTAAATTTTT GGCTTTAGCT CTAGTATTTG CCACACCCTC AACATACGCC 
ATACAGCTGC AATTATTGGG AGGTATAATC ATTCTACAAA CCTTGCCTTC AGTATTCCTA 
GGACTTTACA CTAGCAAACT CAACGGTTAT GCGTTAGTAG GAGGTTGGGC GGGAGGTATG 
TTCAGCGGGA TATATCTAAC GTTATTGGCT AATCACTTCG GACCATTAAA AACCTCATCC 
TTCATAACAC CGTTAGGACC AATGTACATA GGAGTACTAT CAACTCTAAT TAATTTAGCC 
ATAGGACTAA TTGGGACCGC AATAGCTTAT GGCGCTGGCT GGAGACCAGT AAGTAACATA 
AGAGCAGAAG AAATAGCTTA A

Protein sequence

MDGLHVSIVS VALFIILFVI FVFLGFYGSR WRRGDLSKLH EWALAGRRLG PYLMWFLLTA 
DLYTAYTFIA VPSLVLASGP VGFFAAFYSA VTPFIALLFM PRLWTIAKNR GYVTAADFIK 
DRFNSRILAG LVAITGVVAE LPYIALQIVG MQVALLILLL GLGVSNITLA SDLSLLVAFI 
ILAAFVFTSG LRGAALTAVY KDIIILGTII SIAIYVPLAF GGFSGAFHNA QTLSSQINLA 
LNNVNKPIFY NYLPNTLAAR TAYISLAIGS AFALYLYPHA VNASVSSDSK KSLKLSLALQ 
PFYSIILAVI ALFGILVYAN SKVVNFIAKT HSGAVAVPAL IGYSMPDWFV GIALLGIFIG 
GLVPAAIMAI GAANLLTRNI IKEFKPNMSP STESALAKWI STAFKFLALA LVFATPSTYA 
IQLQLLGGII ILQTLPSVFL GLYTSKLNGY ALVGGWAGGM FSGIYLTLLA NHFGPLKTSS 
FITPLGPMYI GVLSTLINLA IGLIGTAIAY GAGWRPVSNI RAEEIA