Gene PICST_89614 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_89614
Symbol	XYL1
ID	4839234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	-
Start bp	898459
End bp	899484
Gene Length	1026 bp
Protein Length	318 aa
Translation table	12
GC content	45%
IMG OID	640390549
Product	NAD(P)H-dependent D-xylose reductase (XR)
Protein accession	XP_001385181
Protein GI	126137315
COG category	[R] General function prediction only
COG ID	[COG0656] Aldo/keto reductases, related to diketogulonate reductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TACAACTATA CTACAATGCC TTCTATTAAG TTGAACTCTG GTTACGACAT GCCAGCCGTC 
GGTTTCGGCT GTTGGAAAGT CGACGTCGAC ACCTGTTCTG AACAGATCTA CCGTGCTATC 
AAGACCGGTT ACAGATTGTT CGACGGTGCC GAAGATTACG CCAACGAAAA GTTAGTTGGT 
GCCGGTGTCA AGAAGGCCAT TGACGAAGGT ATCGTCAAGC GTGAAGACTT GTTCCTTACC 
TCCAAGTTGT GGAACAACTA CCACCACCCA GACAACGTCG AAAAGGCCTT GAACAGAACC 
CTTTCTGACT TGCAAGTTGA CTACGTTGAC TTGTTCTTGA TCCACTTCCC AGTCACCTTC 
AAGTTCGTTC CATTAGAAGA AAAGTACCCA CCAGGATTCT ACTGTGGTAA GGGTGACAAC 
TTCGACTACG AAGATGTTCC AATTTTAGAG ACCTGGAAGG CTCTTGAAAA GTTGGTCAAG 
GCCGGTAAGA TCAGATCTAT CGGTGTTTCT AACTTCCCAG GTGCTTTGCT CTTGGACTTG 
TTGAGAGGTG CTACCATCAA GCCATCTGTC TTGCAAGTTG AACACCACCC ATACTTGCAA 
CAACCAAGAT TGATCGAATT CGCTCAATCC CGTGGTATTG CTGTCACCGC TTACTCTTCG 
TTCGGTCCTC AATCTTTCGT TGAATTGAAC CAAGGTAGAG CTTTGAACAC TTCTCCATTG 
TTCGAGAACG AAACTATCAA GGCTATCGCT GCTAAGCACG GTAAGTCTCC AGCTCAAGTC 
TTGTTGAGAT GGTCTTCCCA AAGAGGCATT GCCATCATTC CAAAGTCCAA CACTGTCCCA 
AGATTGTTGG AAAACAAGGA CGTCAACAGC TTCGACTTGG ACGAACAAGA TTTCGCTGAC 
ATTGCCAAGT TGGACATCAA CTTGAGATTC AACGACCCAT GGGACTGGGA CAAGATTCCT 
ATCTTCGTCT AAGAAGGTTG CTTTATAGAG AGGAAATAAA ACCTAATATA CATTGATTGT 
ACATTT

Protein sequence

MPSIKLNSGY DMPAVGFGCW KVDVDTCSEQ IYRAIKTGYR LFDGAEDYAN EKLVGAGVKK 
AIDEGIVKRE DLFLTSKLWN NYHHPDNVEK ALNRTLSDLQ VDYVDLFLIH FPVTFKFVPL 
EEKYPPGFYC GKGDNFDYED VPILETWKAL EKLVKAGKIR SIGVSNFPGA LLLDLLRGAT 
IKPSVLQVEH HPYLQQPRLI EFAQSRGIAV TAYSSFGPQS FVELNQGRAL NTSPLFENET 
IKAIAAKHGK SPAQVLLRWS SQRGIAIIPK SNTVPRLLEN KDVNSFDLDE QDFADIAKLD 
INLRFNDPWD WDKIPIFV