Gene Ssol_2139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2139
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1924011
End bp	1925264
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	35%
IMG OID
Product	amino acid permease-associated region
Protein accession	ACX92342
Protein GI	261602739
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.578825
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGTAGAA GAAAACTTTC AGTTTTTGAA GCCTTTTCAC TGTCCTTTGG AGGACAAGCG 
CCCTTTACCT CAATAATTAC ATTTGGTACT ATAGGTCTAC AACTTGGTGG ATCCTTCTTA 
ACTATTGCCA CAATTATTGG GACGATTCTA GTGTTAGTGA ATGGCATAGT AATATATAGA 
TTGTCGTTAA GGTATTCCCA ACATGGAGGA TACTTCACCT ATGCCTTCTA TTCGCTTACC 
GAAAGGCTAG GATTAGTAAC TGGATGGCTA TTTTTACTTT ATGCATTTAG TTATGGTGGT 
ACATTATTAG CTGGTTCAAT TTACATTATA ACAAGTTATT TAAAGATAAG TGCTGACCTA 
GTTGCATTTC TAGTCATATT ATTTTCAGCA TTTCTGGTTA TAAGGGGTTT AGATGTTTCC 
GTTAAATACG CCGAGTTCAT AAGTATTGCT GAGATAGTTG CAATAATTGT CAGCTCAGTT 
GTGCTATTGT TAGGGACGAA ACCAAGTTTT AACTTAACGA TTCCGACTAA TCCCTTTCTA 
GTTATACTTT ACGCCATAGG AATGCCCATA GGTTATGGAA ATTTGAACCC AATGAGTGAA 
GATATAAAGA ATGCGAAGAA AATTGTGGGG ATAATTACTG TTATCGTGAT ACTTTTAGGT 
GGATTGCTAT CAGCTTTGCT TTTTTACGCC AGTGCGCTAT ATGGGACTGA TTTGATAGAA 
ATTCTTTTAG ATAAGGTTGG ATTCATATTT CCCTATTTGA TCTTCTCAGC TTTAAATGGT 
GGAATATTGG GTGGAATAGC CTATATTATA GCGATGTCTA GGATCCTTCA TGCAATGTCA 
TTAAAGAATC TTATGCCATC GATTATTTCA TCGGTTAAAT ATAATAGACC ATATAACGCT 
GAGGTCATAT CACTCATTAT CTATACTGTT ATTTTGTTTC TCCTAACTCA CTTCGTTGGG 
CTATATACAA CCTTTCTAGT TTTAGGGGGA CTTACGGTAT TAAGCTATTT GATAATATCA 
CTTTCAGCCA ATCTTTCGCT ATTTAGGATA GCGTTGAAAA AACTAAGGAA GAGAAAAATG 
GAAATAACGA TTGCGATCAC TTCTACGTTA TTATCCTTAA TAATATTAGT GTATTCGATA 
CAAGAAAACA CTCCCATAAT TAACTACATA TTCTTCGCTT GGATAATTGC TGGGTTTATC 
TATGCAGAAG TACTTGAAAT AGCAGGAAAT AATGGAAAAG ATGATGAAGA TTAA

Protein sequence

MSRRKLSVFE AFSLSFGGQA PFTSIITFGT IGLQLGGSFL TIATIIGTIL VLVNGIVIYR 
LSLRYSQHGG YFTYAFYSLT ERLGLVTGWL FLLYAFSYGG TLLAGSIYII TSYLKISADL 
VAFLVILFSA FLVIRGLDVS VKYAEFISIA EIVAIIVSSV VLLLGTKPSF NLTIPTNPFL 
VILYAIGMPI GYGNLNPMSE DIKNAKKIVG IITVIVILLG GLLSALLFYA SALYGTDLIE 
ILLDKVGFIF PYLIFSALNG GILGGIAYII AMSRILHAMS LKNLMPSIIS SVKYNRPYNA 
EVISLIIYTV ILFLLTHFVG LYTTFLVLGG LTVLSYLIIS LSANLSLFRI ALKKLRKRKM 
EITIAITSTL LSLIILVYSI QENTPIINYI FFAWIIAGFI YAEVLEIAGN NGKDDED