Gene Ssol_2703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2703
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	2478470
End bp	2479948
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	37%
IMG OID
Product	permease for cytosine/purines uracil thiamine allantoin
Protein accession	ACX92795
Protein GI	261603192
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGAAC AAGAAATAAA CCACGTTAAT TTAGACTTAA CGGAATATAA TCAAGGAACG 
ACTGTAGTAC CAGACAGTTA CTATAATCCA AACATAGCAC CGCTTCCTAA AAACGCAAAA 
ACATGGACAT GGATAAATTA TGCTACCATA TGGGCTGGAA TGATACATAA CGTCCCCGCA 
TTTATGCTTG CGGGGCTATT AACATTTGAG TTCGGCCCAC TAATAGCATT AATGATCATC 
GCAATAGCCT ACTTTACCTT GCTAATAGCG CTATACTTAA ATGGGCATAT AGGTACAAAA 
TGGGGAATTC CATTCCCCTC ATCAATTAGA CCAATGTTCG GAATAAGGGG TGCTAGAGTA 
CCAGTAATAA TGAGGGCAAT TTCAGCATTG TTTTGGTTCT CCGTTGAGAC CTATGCTGGC 
GGTCTAATAT TAGATGCGCT AATCTCAATC TTTTATCCCT CATGGTCAAC AATCTCAGCA 
GACCTCTTAG GAATGCCACT CCATCTGACA ATTTCGTTCT TCCTCTTTTG GTTCCTTAAT 
GTATTAGTCT TATTTAAGGG AATGGATGAT ATAAAGAAAT TTGAACTAAT TGCTGGTCCC 
TTGGTAATAA TAATCTTAGG AGGTTTGATG ATTCACGCAA TTACTCTTGC AAATGGTCTA 
TCATCATTGT TTCAAATAAG GGGCAATAAC GTTTCATTAC CTAACATAGC CTTAGCAATA 
TCCACAATGG CAGGTTTTTG GGCAACCCTA GTCCTAAACA TTCCGGACTT TACGAGATTT 
TCTAGAAGCC AAAAGGACCA ACTAATAGGA CAAACTATTG GTCTACCTAT ACTTACGTTG 
CTTTTCAGCT TCATAGCAGT TGGGTTAGCA TCGGCAGTAA TTTATATTTA CAATATTCCA 
AGTAATGACA CAATTAATTA TGTAAACCCA GTAAATATAA TGTATCTCTT TACTGACAAT 
CCTTACATAA CGTTAATCTT AGGAATCAGT CTAGTTATTG CAACAATCTC AGTTAACGTT 
GCAGCAAATA TTGTATCACC CGTTTACGAC TTGATAAGTT TATTCCCAAA GAAGCTTAAC 
ACGTGGTCTA AATCAGCTAT TGTATCTGCA ATTCTGGGTT TACTTTACGC CCCATGGTTA 
TGGTACAATA ACGCTTCAAG TATAGAAAAT GTGATAAATT TGATTGGTGC CGGTCTAGGT 
TCTGTCGCCG GAGTCATGAT AGCCCACTAC TGGATATTAG GAAAAACTGA AATTAAACTT 
GCAGATCTAT TTAAGCCAAA TGGAAGATAT TGGTATGTGT CAGGCTATAA CGTTAATGCG 
TTAGTTGCAA TGATCATAGG GTTCTCTGTA CCAGTAATAG GATTTCTAAT TCCTAAACTA 
TCCTTGCTAT ATGACTATGG TTGGTATCTT GGATTATTTT TGAGTATAGC AATATATTTG 
GGATTGGAGA GAAAAAGAGA AGTGAAAATG GAACCTTAA

Protein sequence

MSEQEINHVN LDLTEYNQGT TVVPDSYYNP NIAPLPKNAK TWTWINYATI WAGMIHNVPA 
FMLAGLLTFE FGPLIALMII AIAYFTLLIA LYLNGHIGTK WGIPFPSSIR PMFGIRGARV 
PVIMRAISAL FWFSVETYAG GLILDALISI FYPSWSTISA DLLGMPLHLT ISFFLFWFLN 
VLVLFKGMDD IKKFELIAGP LVIIILGGLM IHAITLANGL SSLFQIRGNN VSLPNIALAI 
STMAGFWATL VLNIPDFTRF SRSQKDQLIG QTIGLPILTL LFSFIAVGLA SAVIYIYNIP 
SNDTINYVNP VNIMYLFTDN PYITLILGIS LVIATISVNV AANIVSPVYD LISLFPKKLN 
TWSKSAIVSA ILGLLYAPWL WYNNASSIEN VINLIGAGLG SVAGVMIAHY WILGKTEIKL 
ADLFKPNGRY WYVSGYNVNA LVAMIIGFSV PVIGFLIPKL SLLYDYGWYL GLFLSIAIYL 
GLERKREVKM EP