Gene PICST_29666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_29666
Symbol	RDH1
ID	4837234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	816664
End bp	817680
Gene Length	1017 bp
Protein Length	338 aa
Translation table	12
GC content	44%
IMG OID	640388549
Product	short-chain alcohol dehydrogenase
Protein accession	XP_001382930
Protein GI	126132810
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.62197
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTACCG CACCACCAAA TATACCATTT CCAGGTCTTC TCGGATGGAA GGCAATGATC 
AATGGGTATT TTCCCTCAAA TCCTTCCTAC ACCGAAGAGC AATACCCTAA ACTCGACGGG 
AAGGTTGTAA TTGTCACCGG TGGAAATACC GGTGTTGGTT ATCAAACTGC TAAATCTTTA 
GCTGGGTCTA CCAATGCTAA GGTCTACATA TTTGCCAGAA GTGAGGAAAA GGCATTGGCT 
GCAATCAGGA GAATGGAACT TGAAGTTGCT CAGGAGTACA ACAAAAGTAG TATTAATGTT 
CACTTCATCA AACTTGACTT GGGTGATTTG ACCACGATCA AAGCTTCTGC TGACGAATTC 
CTCTCCAAGG AAAATAGATT GGACATTGTA ATTCACAATG CTGGTGTCAT GGGCACTTCA 
GTAGGTTCTA AGACAGTTCA GGGGGTTGAA TTACAGTTGG GTACAAACTG CTTTGGACCA 
CACTTGTTGC AGAAGTATTT CGATCCACTT GTCATCGAAA CTTCGAAGAC CAACAAACCA 
TACGAGTCTC GTATAGTGTG GGTGGCGTCT TCGGCACACT TCCAGTCTCC AGAAAGAGGA 
ATTCACTACG CTGACCCAAA CTTTGTGGAC ACTCCACACT TACCAAGAGT ACTCTACTGC 
CAAAGTAAAG CGGTCAACAT CATGCAAGCC ATTGCATGGC CCAAGAATCA TCCTGGTGCG 
GATAGAGTGT TGTCCGTTTC CTTGTGCCCA GGCTTCCTCA ACACTGATAT TCAACGACAT 
GCTAGTGGTA TTTGGAAATG GTTCATACCC TGGGTCCTTC ATGATCCCAG ATATGGTGCA 
TACACCGAAT TATATGCTGC ATTGAACCCT GAGTTGAAAA ACCAAGGTGA ATACTATCAA 
TCCTTCGGTA GATTAGGTGA TATCAGACCA GATATCAAGC TCGAGGAAAA TGTAGATAAA 
GCTTGGGCAT ACTGTGAAGA GCAGGTGAAG GCATACTACA AAACAGTTAT AAAATAG

Protein sequence

MSTAPPNIPF PGLLGWKAMI NGYFPSNPSY TEEQYPKLDG KVVIVTGGNT GVGYQTAKSL 
AGSTNAKVYI FARSEEKALA AIRRMELEVA QEYNKSSINV HFIKLDLGDL TTIKASADEF 
LSKENRLDIV IHNAGVMGTS VGSKTVQGVE LQLGTNCFGP HLLQKYFDPL VIETSKTNKP 
YESRIVWVAS SAHFQSPERG IHYADPNFVD TPHLPRVLYC QSKAVNIMQA IAWPKNHPGA 
DRVLSVSLCP GFLNTDIQRH ASGIWKWFIP WVLHDPRYGA YTELYAALNP ELKNQGEYYQ 
SFGRLGDIRP DIKLEENVDK AWAYCEEQVK AYYKTVIK