Gene PICST_90967 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_90967
Symbol
ID	4840684
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009047
Strand	+
Start bp	443587
End bp	444830
Gene Length	1244 bp
Protein Length	395 aa
Translation table	12
GC content	44%
IMG OID	640391999
Product	Putative trehalase
Protein accession	XP_001386103
Protein GI	150866481
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.146206
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.851818
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

AATCCACCCT AAAAGAAAAA TTTCATGAGC CAAGACGCTG AGGAGTTCCG CGCGTTAACA 
TCAACGCTTC TGGCTTTCTA TAACTACCAC CGGTGGGAAA CAGAGCAGAT AGTCAAACCC 
CGGCGAATCA AATACGATTC GCTTTCAGCA GACGAGAAGC TCTTGGTTCC ATGGTACGAA 
AAGCACACCG AGCACTTGAT GATGTGTATC GAGATGAACA TGCAATTCTG TCAGATGTTG 
GCGACAAATA TTGCCACAGA TTGGGGCGTT TCAGCCGATC CAAATGACTG GGAGCCCGCA 
ACTGCCAATG AGTACGATAA GGTGAGATCA ACTCTATTGC AATTATCGAA GGAATGGAGT 
GACGATGGAC AAAATGAGCG ACAGGTGAGC TACCGCAAGA TTGTGGATGA GTTGGAAGCG 
ATGTTTCCTG ACGAAGAGAA ACGGCAGAAT ATCAAAATTC TCAATCCGGG GTGTGGATTA 
GGACGGTTGG TGATGGATTT GATCGTGAAG GGTTTCTGGT GCCAGGGCAA TGAGTTCAGC 
TACCATATGT TGTTGACATC GAACTTTGTA TTGAACCATT GCAAATTTGC CCACAACTTC 
CTGATCTTTC CATATTTGCA CAAATCGTCG CATATGGTCA AGAGGTTAAA TCAGATTCGG 
CCAGTGAGCT TACCAGATCT CAATCCTACT TCTATAAGCG AATTGAGCCT GAAGAATCCG 
AGTATTCCGT ATGATGAACT CATGTCTATG ACAGCTGGTT CGTTCACCGA CTTGTATGGA 
CCCGAAGACT TGGTTATCTC AGAGACTTAC ACCCAGGATA CCATTGCCAA CGAGTTTCGA 
TCCACCAACA AGGACCATTT CGACGTGCTC GTGTCGTGCT TCTTCATCGA TACAGCCAGC 
AATATCATTG ACTATTTGAA GTCTATCCAT TACTGTTTGA AGACTGGCGG GGTGTGGATC 
AACTTTGGCC CGTTGTTGTG GCATTTCGAA GACGATTTCT CGACCAAAAT CATATCCAGA 
GATAATACAA AAGTACAGAC TATCATGAAG GGATTGGAGT TGTCGAGAGA GGACTTAGTT 
GAATTGGTGG AGAAGATTGG ATTCAAGTTC GAGAAACGTG AGTCGGACAT TGAGACTACC 
TACTGTGGAG ATATCAAGGC GTTGGGATCG TTTGTGTATA AATGTGAATA CTGGGTGTGT 
CGTAAGTTGT AAAGGTATAG ATTAAAATGA AGTAATTTAA AGGC

Protein sequence

MSQDAEEFRA LTSTLSAFYN YHRWETEQIV KPRRIKYDSL SADEKLLVPW YEKHTEHLMM 
CIEMNMQFCQ MLATNIATDW GVSADPNDWE PATANEYDKV RSTLLQLSKE WSDDGQNERQ 
VSYRKIVDEL EAMFPDEEKR QNIKILNPGC GLGRLVMDLI VKGFWCQGNE FSYHMLLTSN 
FVLNHCKFAH NFSIFPYLHK SSHMVKRLNQ IRPVSLPDLN PTSISELSSK NPSIPYDELM 
SMTAGSFTDL YGPEDLVISE TYTQDTIANE FRSTNKDHFD VLVSCFFIDT ASNIIDYLKS 
IHYCLKTGGV WINFGPLLWH FEDDFSTKII SRDNTKVQTI MKGLELSRED LVELVEKIGF 
KFEKRESDIE TTYCGDIKAL GSFVYKCEYW VCRKL