Gene PICST_79198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_79198
Symbol	YBO9
ID	4839816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	-
Start bp	1154099
End bp	1155272
Gene Length	1174 bp
Protein Length	346 aa
Translation table	12
GC content	44%
IMG OID	640391131
Product	beta-hydroxysteroid dehydrogenase type 3
Protein accession	XP_001385917
Protein GI	126138788
COG category	[R] General function prediction only
COG ID	[COG0300] Short-chain dehydrogenases of various substrate specificities
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.103283
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

AATTGAACAA TGTCTGTAGT AGATTTTATT CAAGCCATTA CCGAAAACAA ATTCGGCGAG 
TATGTTCTCC TTGGAGCATT GCTCGTTGGA GTTTTCAAGC TTACTGTGTT CATTCTCAGT 
GTGACTTCGC TTTTGGTTGA TTTGTTCGTC TTGCCAGCCA CAAACTTGAA GACTTACGGT 
GCCAAAAAAG GCAAGTGGGC TGTTATAACT GGTGCCTCTG ATGGAATTGG AAAGGAGTAT 
GCCTTCCAAT TGGCCTCCAA AGGATTCAAT GTAGTTTTGG TATCGAGAAC CCAAGCCAAG 
TTGGAAACTC TTGCTTCTGA GATCGAAGCC AAGTACAAGG TGGAAACCAA AGTAGTAGCA 
TTTGATGCTT CTACGGACGC TGAAGACAAC TACAAGTCTC TAGGTGATGC TATTTCCGGT 
TTGCCTGTAA CTGTTTTGAT CAACAATGTT GGCCAATCGC ATTCGATTCC CGTTCCATTC 
TTGGAAACTG AAAACAAGGA ATTGCAAGAT ATTATCACAA TCAACGTCAC AGCCACTTTG 
AAGATCACCC AAACTGTAGC TCCAGTGATT GCCGAAACTG TTTCCAAGGA AAAGAAGAAG 
GTCAGAGGTT TGATATTGAC TATGGGCTCT TTTGGTGGTT TGTTACCCAC TCCATATTTG 
GCTACTTACT CTGGTTCCAA GTCGTTTTTG CAAGCTTGGT CTGCTGCTTT GGCTGGAGAG 
TTGCAATCTC AAGGTGTGGA TGTGGAATTG GTTATTTCGT ACTTGGTCAC TTCTGCCATG 
TCGAAGATCA GAAGAGCCTC TTTGTCGATT CCTAGCCCTA AGAACTTTGT CAGAGCCACT 
TTAAACGGCA TTGGACGTCG CAACGGTGCG CAGGAACGTT ATGCAACTAG CACTCCTTAC 
TGGGCCCATG CCTTGATGCA TTTCGGCATT GACCAGACTG TAGGTGTCTA CTCCAAGCTT 
GCCAACAGTC TTAACTTGAA CATGCACAAG AGCATCCGTG CCAGAGCCTT GAAGAAGGCT 
GCCCGTTTGG CTGCGGAAAA GAAAGATTAG ATGGAATTAT CCACTAGTAT AATTTCTATG 
TAGATCCTAC TATCTAGTTG ACTGCAGTGA TTATATACTG AAAGAGCAAA CGTACAATTG 
TGCAAATATA TGGATACCAT TGAGTATACT TTGG

Protein sequence

MSVVDFIQAI TENKFGEYVL LGALLVGVFK LTVFILSVTS LLVDLFVLPA TNLKTYGAKK 
GKWAVITGAS DGIGKEYAFQ LASKGFNVVL VSRTQAKLET LASEIEAKYK VETKVVAFDA 
STDAEDNYKS LGDAISGLPV TVLINNVGQS HSIPVPFLET ENKELQDIIT INVTATLKIT 
QTVAPVIAET VSKEKKKVRG LILTMGSFGG LLPTPYLATY SGSKSFLQAW SAALAGELQS 
QGVDVELVIS YLVTSAMSKI RRASLSIPSP KNFVRATLNG IGRRNGAQER YATSTPYWAH 
ALMHFGIDQT VGVYSKLANS LNLNMHKSIR ARALKKAARL AAEKKD