Gene PICST_84519 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_84519
Symbol	SIS1
ID	4839815
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	-
Start bp	1152177
End bp	1153446
Gene Length	1270 bp
Protein Length	344 aa
Translation table	12
GC content	44%
IMG OID	640391130
Product	Molecular chaperone (DnaJ superfamily)
Protein accession	XP_001385916
Protein GI	150866349
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.35649
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

AGATTTCACA ACATGGTCAA GGAAACAAAA TTGTACGACT TATTGGAAGT TTCACCTTCT 
GCCTCTGAGA CGGAAATCAA GAAAGCCTAC AGAAAGGCAG CCTTGAAGTA CCATCCAGAT 
AAACCTACTG GGGATACTGA AAAATTCAAG GAGGTCTCTG AAGCATTTGA TATTCTTTCC 
AACGGAGACA AAAGGCAAGT CTATGACGAC TACGGCTTAG AAGCAGCCAG AGGAAATGCA 
CCAGCTGGTG GAAATCCATT CGCTGGTGCC GGCTCTGGCA ATCCTTTTGG CGGTGCCGGA 
GGTTATGGCG GAGGTCACCA CGGCTTTTCT CAGGCTGATG CCTTCAACAT TTTCTCACAG 
ATGGGAGGAT TTGGAATGGG AGACGATGGA TTCAGCTTCA GCAGTAGTGG CCCTGGAGGT 
TTTGGAGGTG GCCATCCTTT TGGAGGAGGT GCTGGTGGTA TGCCTGGAGG CTTTGGTGGC 
CAGGGATTTG GCGGCCGTTC TGCTCGTCGT CCAGAGCCTG ATACCGTTTC TATGCCCTTA 
CCAGTCTCTT TAGAAGATTT GTTCCATGGT GGTGTCAAGA AGATGAAGTT GAACAGAAAG 
GGACTTCATG GAGAAAGAGA GAGTAAGGTG TTGGAAGTCA ACATCAAACC AGGCTGGAAG 
GCCGGAACGA AGATCAACTT CACCAATGAA GGAGACTATC AGCCAGAATG TCAAGCCAGA 
CAGACCCTTC AATTCGTGTT GGAAGAAAAG CCTCATCCTG TGTTCAAAAG AGACGGTACC 
AGTAACAACT TGATTGTGAA CCTTCCAATA ACCTTCAAAG AATCCTTGTG TGGGTTCGAT 
AAGGATATAA CCACTATTGA TGGAAAGAGA CTTCCATTCT CCAAGACTCA GCCAGTCCAA 
CCTAACTCTT CAGCACTATA CCCAGGCTTA GGTATGCCAA TCAGCAAGCT GCCAGGCCAA 
AGAGGTGATA TGGAAGTGAT TTTCAAAGTT GACTATCCTA TCAGTTTGAC TCCTCAACAA 
AAACAAGCAA TACAGACCAA TTTCTAGGAT CAAGAAACAT AAAACACAAA CACAAATACA 
AAACATAACG ACTACACAAT TCATCGCTGC GATTTGTCAC GATTAATAGA CGCATTACAT 
AGAATGTTCC TCGGCTGGAC ATATCCATGA CATTCCTTCA CTTCTTGATA AACTTACTGC 
TTTGCCGATT TGCATGCTAA TATAAATAGT ACTACTACAA TCAATATAAT CATTAGAACA 
GAAATAGTAG

Protein sequence

MVKETKLYDL LEVSPSASET EIKKAYRKAA LKYHPDKPTG DTEKFKEVSE AFDILSNGDK 
RQVYDDYGLE AARGNAPAGG NPFAGAGSGN PFGGAGGYGG GHHGFSQADA FNIFSQMGGF 
GMGDDGFSFS SSGPGGFGGG HPFGGGAGGM PGGFGGQGFG GRSARRPEPD TVSMPLPVSL 
EDLFHGGVKK MKLNRKGLHG ERESKVLEVN IKPGWKAGTK INFTNEGDYQ PECQARQTLQ 
FVLEEKPHPV FKRDGTSNNL IVNLPITFKE SLCGFDKDIT TIDGKRLPFS KTQPVQPNSS 
ALYPGLGMPI SKSPGQRGDM EVIFKVDYPI SLTPQQKQAI QTNF