Gene PICST_81469 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_81469
Symbol	RDH2
ID	4837133
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	819796
End bp	820800
Gene Length	1005 bp
Protein Length	334 aa
Translation table	12
GC content	44%
IMG OID	640388448
Product	short-chain alcohol dehydrogenase retinol dehydrogenase Protochlorophyllide reductase
Protein accession	XP_001382931
Protein GI	126132812
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.761909
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.570556
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCACG AAAAGCCCAA AGTTCCTTGT ATGACCTGGG GCGCATTCAT GCAAATCACC 
GATAACTTCT GGCCAGGTCC ACCTACTCTT ACAGAAAAAG ACTATCCCTC TTTGACTGGG 
AAGGTTGTAA TTGTCACCGG TGGAAATACC GGTGTTGGTT ATCAAACTGC TAAATCTTTA 
GCTGGGTCTA CCAATGCTAA GGTCTACATA TTTGCCAGAA GTGAGGAAAA GGCATTGGCT 
GCAATCAGGA GAATGGAACT TGAGGTCGCC CAGGAGTACA ATAAAAACAA AATTGATGTT 
CACTTCATCA AGCTTGACTT GGGTGATTTG ACCACAATCA AAGCCTCTGC CGACGAATTC 
CTCTCCAAGG AAGATAGATT GGATATTATC ATCCATAATG CTGGTGTCAT GACCCCACCA 
AAGGGTTCCA AGACAGCACA AGGTTTTGAA TTACAACTAG GCACGAATGC CATAGGACCA 
CATTTGTTTC AGAAATTCTT GGACCCATTA TTCATTAAGA CGTCTAAGTC CAACAAGCCT 
GGAGAATCCA GAGTTGTATG GGTTGCATCT TCCGGACACT TCTTTTCTCC CGAAGGAGGA 
ATCTTCTATC CAGATCCCAA TTTCAGAAAC ACCAACTTCC CATCCATGCG GATTTACGGA 
CAAAGCAAGG CTTGTAATGT CATGCAATCA GTTGAATGGC CCAAACACCA TCCAGAAGCA 
ACTAACGTTA TCAGTCTCAA TTTATGCCCC GGCGCCTTGA AGACAGATTT ACAAAGACAC 
ACAGGCACCG CGGGCCGCAT CATGTCCGGC TTGTTACATG ATGCTAGAAA AGGTGCTTAC 
ACTGAACTCT TTGCAGCCTT ATCTCCCTCC ATCACAGTCA AGGACCAAGG CATTCATGTT 
ATTTCCTTTG GAAAGATTGG CTTCAACAGA AAGGATCTTA AAGATCCAGC TAATACTTCT 
AAGGCTTGGG ACTTCTTGGA CAAACAAGTT GAAAAGTATT TGTAA

Protein sequence

MSHEKPKVPC MTWGAFMQIT DNFWPGPPTL TEKDYPSLTG KVVIVTGGNT GVGYQTAKSL 
AGSTNAKVYI FARSEEKALA AIRRMELEVA QEYNKNKIDV HFIKLDLGDL TTIKASADEF 
LSKEDRLDII IHNAGVMTPP KGSKTAQGFE LQLGTNAIGP HLFQKFLDPL FIKTSKSNKP 
GESRVVWVAS SGHFFSPEGG IFYPDPNFRN TNFPSMRIYG QSKACNVMQS VEWPKHHPEA 
TNVISLNLCP GALKTDLQRH TGTAGRIMSG LLHDARKGAY TELFAALSPS ITVKDQGIHV 
ISFGKIGFNR KDLKDPANTS KAWDFLDKQV EKYL