Gene PICST_84338 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_84338
Symbol	DEG1
ID	4840127
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	+
Start bp	321058
End bp	322639
Gene Length	1582 bp
Protein Length	465 aa
Translation table	12
GC content	41%
IMG OID	640391442
Product	pseudouridine synthase
Protein accession	XP_001385404
Protein GI	150865972
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0101] Pseudouridylate synthase
TIGRFAM ID	[TIGR00071] pseudouridylate synthase I

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.188482
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.052244
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CTTTTACGAT GAGCATCAAT ACCAATTTCA ACTTTTCACT TCCAGCGAGC CTATTACTGG 
GATCCAGCAG TAGTATCAAA TACCAGGTGT ATGCTAAGGT ATAGACCGAC GTGGGCGATG 
CTCAAAAGGA CATTTAGCAG CATGACCAAA ACAGAAGCAA GGGTCGATTA TGAAAACTGG 
ACTAAAGAAC AGCTTATAGA AAGAATCCAA CAGTTGGAAA ATTCATCCTC GAAATTAAAC 
TCAACACTTC CAGTTGCTAG TCCAGTTGTA AACGATGCAG TTGCTTCCGC AAAAGACATA 
AGTAGATCAG AGTCTGCTCC TCCAATCATG GACATGGCCA CAGAAGGGTC AAAGAAAAAG 
AAAAAGGTTC GAACTTTCGA TATGAACAAA TACAACAAGA GATTTATAGC ATTGAAATTT 
GCCTATTTAG GTTGGAACTA CAACGGATTG GCCTACCAGC TGGAGCCAAC ACCATTGCCT 
ACTGTTGAAG AAGTCGTTTT GAAAGCTTTG ACGATGTCAA GACTTATTAC TGAACCTACT 
CCAGACAAGT GCAAGTTCAG TCGTTGTGGC CGTACTGATA AAGGTGTCAG TGCCATGAAC 
CAAGTCATCT CGTTAGTCGT GAGATCCAAC TTAAATGAAG AAGAGCAATT GCTCAAAGAA 
AACGACCACA AAGAAATCAA GTACTTGTCC ATCATTAATG CTTTGTTACC TCCAGATATA 
AGAATGACAG CTGTCTGTTT AAGACCTCCT CCTAAATTCG ATGCTAGATT CAGTTGCGAC 
TATAGACACT ACAGATACTT GTTCAAGAAA CACGATCTTG ATATTGAGCT TATGAATGAG 
GCTTGCATAA AATACATCGG ATCCCATGAC TTCCGTAACT TTTGTAAGAT TGACGGATCC 
AAACAGATCA CAAACTACGT CAGAGAAGTC TACAGCATGA AAATCATCCA CCTAAAAGAT 
GATTTTTATG CTGTTGACTT GAAGGGTTCT GCCTTCCTTT GGCATCAGGT CCGTTGTATG 
GTGGCTATAT TGTTCTTGAT TGGTCAGAAG CTTGAAGCTA CCACCATAAT CGAAGACTTG 
TTTGACTTGG AAAAATATCC TACTAAGCCA GTCTACGAAA TGGCCAATGA TATTCCCTTG 
GTTCTCTACG ATTGTATATA TCCGGAAATG GAATGGCTCT CGCCAATCGG GTCTGAAGGT 
ACCATCGAGA AGTTCTACAA ACACTTCGCC ATGTTCAGGG GCCAAGTATT GGACTACCAA 
GTTAAGGCTA ACATGATTGG AATTATGGAA CCATTGGTAA TGAAAGATGC TCCTGAAATT 
GAGAACACCC AGAAACGTGG AACCATGAAT GTTGGTGATG GTAGTGGTCG TAACTATTCC 
AAGTACGTTC CAATCAGCAA GCGTGAAGTA GGCGAAACCG TTGAGGCAAT CAACTCAAGA 
CACAAGGAAA AGAAGAGAAA AAGAGCCATT GCACTCAGTG AAGCTAACAG CAGGGCAGAC 
AGCGAAGTCA GTAGCATTTT AGAAGAACAA TAGTCCTGTA AATATTGTAT CATAGACTTT 
AGAATAGATG GAATCTAACT GG

Protein sequence

MLRYRPTWAM LKRTFSSMTK TEARVDYENW TKEQLIERIQ QLENSSSKLN STLPVASPVV 
NDAVASAKDI RSKKKKKVRT FDMNKYNKRF IALKFAYLGW NYNGLAYQSE PTPLPTVEEV 
VLKALTMSRL ITEPTPDKCK FSRCGRTDKG VSAMNQVISL VVRSNLNEEE QLLKENDHKE 
IKYLSIINAL LPPDIRMTAV CLRPPPKFDA RFSCDYRHYR YLFKKHDLDI ELMNEACIKY 
IGSHDFRNFC KIDGSKQITN YVREVYSMKI IHLKDDFYAV DLKGSAFLWH QVRCMVAILF 
LIGQKLEATT IIEDLFDLEK YPTKPVYEMA NDIPLVLYDC IYPEMEWLSP IGSEGTIEKF 
YKHFAMFRGQ VLDYQVKANM IGIMEPLVMK DAPEIENTQK RGTMNVGDGS GRNYSKYVPI 
SKREVGETVE AINSRHKEKK RKRAIALSEA NSRADSEVSS ILEEQ