Gene PICST_65073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_65073
Symbol	PUP1
ID	4851978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	3345720
End bp	3346852
Gene Length	1133 bp
Protein Length	267 aa
Translation table
GC content	42%
IMG OID	640393686
Product	20S proteasome, regulatory subunit beta type PSMB7/PSMB10/PUP1
Protein accession	XP_001386964
Protein GI	126276195
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0638] 20S proteasome, alpha and beta subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.197238
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

AGAACACAAG CCTATTGGTT GAAACCGGTC AATTCTAACC TCTACTTATC GCTGATTCAC 
ATAGAAAAGA CTGCAATAAC TTCCAATAGA GTCAGACGGA TCAATACATC AATTTCGTTG 
ACATTGAATT AATCATTGAA TATCACCGAA TCCCGATCAA CCTCGTTTAA ACCTCATATT 
AATCACAAAT TGTATTGAAT TGAGAGTAGA TTTTTCATTC ACGACTTCAA ACCATTACAA 
ATTCAACCGT TGAGCTCATA TAGAAGTCAA CAATTGAAAC TTAAAACAAT AGATTTAATC 
AAATCATTAA CAAATTATCA TAACATACAA TGCCTGGCTT GAACTTCGAC AACTACCAGA 
GAAACTCGTA TCTCACCACT AAGGGTTACG GAACTCCCAA GGCTACCTCT ACTGGTACAA 
CTATTGTAGG CTGTAAGTTT AAAGGAGGGG TGGTGATTGC TGCTGATACT CGTGCTACGG 
CCGGAAGCAT CGTGGCCGAT AAGAACTGTG AGAAATTACA TAGACTAGCA CCCAAGATCT 
GGTGTGCTGG TGCCGGTACA GCCGCTGATA CTGAGATGGT AACTCAATTG ATAGCTTCAA 
ACTTGGAGTT GCACGGACTT TACCAGAATA GGCAACCCCG AGTCATCACC GCTTTAACGA 
TGTTAAAGCA ACACTTGTTC AAGTACCAGG GCCATTTGGG TGCCTATTTG ATTGTAGCTG 
GTGTAGATCC AACTGGCGCT CATTTGTTGT CGGTACAAGC TCACGGTTCT ACCGATATCG 
GCAAGTACCA GTCGTTGGGT TCTGGTTCGT TGGCAGCCAT GGCTGTATTG GAAACTAATT 
TCAAGGAAGA CATGACCAAG GAAGAGGCCA TCAAGTTATG TGCAGATGCT ATTGAGCTGG 
GTATCTGGAA TGATTTGGGT TCCGGTTCGA ATGTAGACAT ATGTGTGATG GAAGTAGGCA 
AAGATGCTGA ATTGTACAGA AACTACTTGA CTCCAAATGT CAGATCAGAG AAGGCAAGAT 
CGTACAAGTT TGCTAGAGGA TCTACTGCTG TGTTGAGAGA AACTGTACGT GATATTTTGG 
ATGTAGAGGA AACGGTTGTC ACATTTGGTG ATGCTATGGA GGTGGATGCA TAG

Protein sequence

MPGLNFDNYQ RNSYLTTKGY GTPKATSTGT TIVGCKFKGG VVIAADTRAT AGSIVADKNC 
EKLHRLAPKI WCAGAGTAAD TEMVTQLIAS NLELHGLYQN RQPRVITALT MLKQHLFKYQ 
GHLGAYLIVA GVDPTGAHLL SVQAHGSTDI GKYQSLGSGS LAAMAVLETN FKEDMTKEEA 
IKLCADAIEL GIWNDLGSGS NVDICVMEVG KDAELYRNYL TPNVRSEKAR SYKFARGSTA 
VLRETVRDIL DVEETVVTFG DAMEVDA