Gene PICST_84214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_84214
Symbol	SDT1
ID	4839592
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	-
Start bp	959905
End bp	961072
Gene Length	1168 bp
Protein Length	287 aa
Translation table	12
GC content	40%
IMG OID	640390907
Product	suppressor of deletion of TFIIS
Protein accession	XP_001385193
Protein GI	150865821
COG category	[R] General function prediction only
COG ID	[COG1011] Predicted hydrolase (HAD superfamily)
TIGRFAM ID	[TIGR01509] haloacid dehalogenase superfamily, subfamily IA, variant 3 with third motif having DD or ED [TIGR01993] pyrimidine 5'-nucleotidase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.538947
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0127046
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TCGTCGAAGA AAGATATTAA GAGTTTATTA GATAGAAAGA ACTTGTTGAA CCTTTCTAGA 
ACTTTTCAAT TTTTGTTTCT ATTTTTCGAT TTCAGCATCC ATTTCCAGAT ATTTTTCACT 
CCTTAGTCAT CTGAACCATA ATATAAATCT ATAATTCGAT TTCATCACAA CAAATACTAA 
ATTTCATCTT TTTCAAATAC AAATTTATAC ATGAAATCAT TCTGAAAACT CAGAATCTTC 
TAACCTCTCA GCCCTCACAC AGCAGATCTA CACACGATGA CTATTTCAAA ACTCGAAGTC 
CAGACGAATC CCGTTCACTA CACCAACCCA GAGCTCACGG AACAGGAACA ACTTCCAGGA 
ACTATTGTCC ACTTGCCCTT TGGCTACGGG CCCATGCCAG AAAGCTTGAC CAACAAGAAG 
ATCTTCTACT TTGACATCGA TAACTGTTTG TACCATCGTT CAACGCTGAT CCACGAATTG 
ATGCAAGTCA AAATCCACAA CTATTTCAAA GACAACCTAC AGCTCAACGA CGAAGACGCC 
CACAAGTTGC ACATGAACTA CTACAAGACC TACGGGTTGG CTATTGAAGG TTTGGTAAGA 
AACCACCAGG TGGATGCTTT GGACTACAAT GCCCAAGTTG ATGATTCTTT AGACTTGAAA 
TCTGTTTTGT CGTACAATGC TGAATTGCGT AAAATGTTGA TTGCTATTAA GGCAAGTCAT 
CAGTTCGACT ATTTCTGGTT GGTGACGAAC GCGTACAAGA ACCACGCCTT GAGAGTGGTA 
TCGTTCTTAG GATTGGGTGA CTTGTTTGAA GGCTTGACCT TTTGTGATTA CTCTAAGTTC 
CCTATCATCT GTAAACCTAT GGCCAAGTTC TTTCATGGTA CACTTAACGT TACCAATGTG 
GACTATAATG ACGCCGAGGT CATGAAGAAA CAGTACTTTA TCGACGACAG CGAGCTTAAC 
GCAAAGGCTG CTCACAAGTT GGGCTTTGGA AATGTGATCC ATTATGTGGA AATTGACCTG 
GACTACGATA GAATCAAAGC AAAGCCCGAT TTTGAAGAAT ATTATGGAGC TGGCGATAAT 
AGCGACAAGT CCAAAATCAG AATACTCCGC CACATACTTG AATTGCCTTC TGTCTTGTAG 
ATCATATAGA ATAATAAACA CAATATAG

Protein sequence

MTISKLEVQT NPVHYTNPEL TEQEQLPGTI VHLPFGYGPM PESLTNKKIF YFDIDNCLYH 
RSTSIHELMQ VKIHNYFKDN LQLNDEDAHK LHMNYYKTYG LAIEGLVRNH QVDALDYNAQ 
VDDSLDLKSV LSYNAELRKM LIAIKASHQF DYFWLVTNAY KNHALRVVSF LGLGDLFEGL 
TFCDYSKFPI ICKPMAKFFH GTLNVTNVDY NDAEVMKKQY FIDDSELNAK AAHKLGFGNV 
IHYVEIDSDY DRIKAKPDFE EYYGAGDNSD KSKIRILRHI LELPSVL