Gene PICST_31961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31961
Symbol	SCJ1
ID	4839396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	-
Start bp	320035
End bp	321159
Gene Length	1125 bp
Protein Length	374 aa
Translation table	12
GC content	46%
IMG OID	640390711
Product	dnaJ homolog in endoplasmic reticulum
Protein accession	XP_001385080
Protein GI	150865743
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.108543
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGTTG TCACGATACT AGCAGTGCTT TTCGTAAACT TCGCACTTCT TATTGCGGCT 
GCGCAAAAGG ACTATTATCA GATTCTTGGA GTGAACAAGG ATGCTGGCGA AAAAGAGATC 
AAGCTGGCCT ATAGACAGTT GAGTTTGAAA TACCATCCAG ATAAGAATCC TGGCAGTGAA 
GAAGCACACG AGAAGTTTTT GGAAGTGGGT GAAGCTTACG ACGTTTTGAG CAATTCCGAA 
AAGAGATCAA ACTACGACAA ATTTGGTGAC GCCAACGGAG GACCGTCTAA CCAGGAGTTC 
CAGTTTGATT TTGGAGATAT GTTTGGACAA TTCTTTGGAG GTCACGGTGG TGGTGGTCAA 
GGCGGCCAGA GAGTACGTAA GGGTGACAGC ACACAAGTAA ACTTGCATGT AGCACTTGGC 
GATTTCTATA ATGGAAAGTT GTTGGAGTTT GATGTTGAGA TGATGAACAT CTGTGAGAAA 
TGTGAGGGTA CTGGATCAAA GGATAGACAA ACCCATACAT GTGACAAGTG CAAGGGTGCC 
GGAGTAGTGA CAGTTCGTCA TCAGCTTGCT CCCGGTATGG TTCAACAGGT CAGAATGCAA 
TGTGACCAGT GCGGAGGTAA GGGTAAGACT ATAGCCCATA AATGTGGCTC CTGCTCAGGA 
AAGGGTGTCC ATGCTGGACC CAGACATTAT GAAGTATACA TCAAACCGGG CCAGCCGCGC 
GATTCCAACA TTGTTTTGCA TGGCGAAGGT GACAGGAATC CAGACTGGGT TCCCGGCGAC 
TTGATTATTA ATGTCCGCGA GGAGTTCGTC AAGAGCTGGG GCTACAGACG GATCCATAGT 
AATTTGTACA GAACAGAAGT CTTGACTTTG AACGAATCCA TCGAAGGAGG CTGGGAGAGA 
AAGATTGCAT TTTTGGATGC CGAAGATAAC GTTCTTACGT TGAAGAGAGA AAAAGGTGTC 
AGGGTTACAG ACGGAGAAGT AGAGATCATC AAGGGCAAGG GGATGCCATT GTTGGATGAG 
CACCAGGACC ATAATGATGA TTACGGAGAT TTATTCATCC AGTACAAGAT CCTTGTAGCT 
GGGGGTAAGG CACAGAAGTT GCTGCACGAG AAAGATGAAT TATAG

Protein sequence

MRVVTILAVL FVNFALLIAA AQKDYYQILG VNKDAGEKEI KSAYRQLSLK YHPDKNPGSE 
EAHEKFLEVG EAYDVLSNSE KRSNYDKFGD ANGGPSNQEF QFDFGDMFGQ FFGGHGGGGQ 
GGQRVRKGDS TQVNLHVALG DFYNGKLLEF DVEMMNICEK CEGTGSKDRQ THTCDKCKGA 
GVVTVRHQLA PGMVQQVRMQ CDQCGGKGKT IAHKCGSCSG KGVHAGPRHY EVYIKPGQPR 
DSNIVLHGEG DRNPDWVPGD LIINVREEFV KSWGYRRIHS NLYRTEVLTL NESIEGGWER 
KIAFLDAEDN VLTLKREKGV RVTDGEVEII KGKGMPLLDE HQDHNDDYGD LFIQYKILVA 
GGKAQKLSHE KDEL