Gene Ssol_2237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2237
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	2016902
End bp	2018503
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	37%
IMG OID
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	ACX92426
Protein GI	261602823
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.822439
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAATTC CCCCAATATT AAGACTGAAG CTACTTTGGG TTGCGCTAAT TATATTCATT 
TTTCTTTTAG GGAGTATTGC ATATGGTTTC TTTACAGCGC CTAAGGCAAA CCCTTATACA 
CCAGCTGGTC AGTATGCAGC TTCACCATAT GCAGTGCCTT CGTGGGCTTC AATCTTCTAC 
GGTAATCTTC CACCTGACAT AAAAGTACCT AATGATTATG ATCTGATTGC TGCGAAGACA 
GCATCTGTTA TAAATTATTG GCATTTGTCT AACTTTACTT TTAACGGAGA TGCTGTTATA 
ATAATTTATA ATAGTAGCTA TGGACCCAAG GGAGAAACTA ACTTCCAAAA GACACTTTAT 
TCTTATGGAA ACACTGGAAA CGGGAGTGTA GAGATAATAA TAGAAGGAAC TAATCCATTA 
AATTTAACTC TGTATCATGA CTTTCTTTAT AACTATTTAT TGCCTAGAGA GACAAAATTT 
GGAGACTATG AATTCTATAT CATCCAAGCC AGTATTTCCG CTTATGCTAC AAACGCTTAC 
TATACTTTTA ATGGATATGT GATAAATCCG TCAAATGCCA CATTTTGGTT GTTCTTAGCT 
GGGAACTACT TGCCAACAAA TTTGGTTACG CTCTCAACTG TATTTAAGTA CTTAGGGAAT 
GGAGGATGGA ATTACATATT AGCATCTTCG GCATCAGCTG GAGAAACTCC ATGGTTCTAT 
ACCTCAAATA TACCTCCTAA TGAAAGCGCA GTAGCTTCTG TTATAATGCT TCAAAGCATG 
TTTAATAGTA CCGGAAATTA CAAGGTGGAA TTCACCATAA ATTATATCCC AAACGGACCT 
AACTCCAAAT TAGTAGTTTA CTTATCTGAC CTTTATTTCG AATTTCTTGG TAGTAGATAT 
GGAGTATTGG GTACTGATAA TAATGGGGCT AGTGTGTTTG CAGAGTATTC ACAAGGTGGA 
ATATTCGACC TTGAACTCGC AATACTTGCT GGGTTGGCAA TAGTATTCAT AGGTGCGGTA 
TTTGGCTTAT TTGCTGGTTA TTATGGTGGG AAGTTGGATC AAATATTAAC CTCATTTACT 
GATTTCATAC TACTACTCCC TGGGTTAGCA ATACTAATAG TCTTAATAAC CATATTCCAA 
CAAATCTTTA CAGTTTTCCC TAAGGATATT TTAATCATAA TAGTTTTAGT AATTCTAAGC 
TGGCCTCCTA CGTCTAGAAC AATAAGAGGA CAAGTTCTCC AAGTTAGAAA TATGGCATTC 
GTTGAAGCCG CTAAGGCTTT AGGAATGTCC AATATGGAAA TCATAAGAAA GCACGTGTTA 
AGGCACGTTT TCCCAATAAT TATAGCACAG CTAATCTTCG ATATTCCAGC TGTGATAGGT 
ATAGAGTCAG CCCTAGACTT TCTAGGTATT GGAATACTTA AATTCCCAAC ATGGGGTAAT 
ATGTTAGGGT TCTCAATTAA TGCCTCACTA GACGCTCCTG GATTTGCATG GTGGTGGATT 
CTGACACCAG GTATAGCGTT ATTTCTCTTG GGCGTTAGTC TATTTTATAT AGGTGAGGCG 
ATAACTAGGT ATTATGGAAG TTTAGTTGGT GAGACCCATT GA

Protein sequence

MRIPPILRLK LLWVALIIFI FLLGSIAYGF FTAPKANPYT PAGQYAASPY AVPSWASIFY 
GNLPPDIKVP NDYDLIAAKT ASVINYWHLS NFTFNGDAVI IIYNSSYGPK GETNFQKTLY 
SYGNTGNGSV EIIIEGTNPL NLTLYHDFLY NYLLPRETKF GDYEFYIIQA SISAYATNAY 
YTFNGYVINP SNATFWLFLA GNYLPTNLVT LSTVFKYLGN GGWNYILASS ASAGETPWFY 
TSNIPPNESA VASVIMLQSM FNSTGNYKVE FTINYIPNGP NSKLVVYLSD LYFEFLGSRY 
GVLGTDNNGA SVFAEYSQGG IFDLELAILA GLAIVFIGAV FGLFAGYYGG KLDQILTSFT 
DFILLLPGLA ILIVLITIFQ QIFTVFPKDI LIIIVLVILS WPPTSRTIRG QVLQVRNMAF 
VEAAKALGMS NMEIIRKHVL RHVFPIIIAQ LIFDIPAVIG IESALDFLGI GILKFPTWGN 
MLGFSINASL DAPGFAWWWI LTPGIALFLL GVSLFYIGEA ITRYYGSLVG ETH