Gene PICST_59150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_59150
Symbol	SAD1
ID	4838558
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	1459782
End bp	1460843
Gene Length	1062 bp
Protein Length	353 aa
Translation table	12
GC content	48%
IMG OID	640389873
Product	secondary alcohol dehydrogenase (SADH1)
Protein accession	XP_001384580
Protein GI	126136112
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.318338
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.350827
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCATCC CAAAAACACA AGTTGCTTAC GGTTATGTCC CCGGCAAGAA GACGATTCAA 
TGTTTCCCCA ACCACCCAGT GCAGACCCCA GGAGATAACC AGGTTTTGTT GAAGATCGAG 
GCTGCTGGTA TGTGCCATAG CGACCACAAC ATCCTCCTTT CTGGCCCTCT TGCAGGCGGT 
AAAGGTGAAC CTAAGATGGT AATGGGTCAT GAGATTGCTG GCCAGATTGT CCAAGTCGGA 
AAGAACCTCG AAAAATCCGA TATCTACGAA ATCGGTGGCC GCTTCGCTGT GACGATCGCC 
AAAGCATGTG GAGAGTGTGA GATGTGCCGG GGAGGTGTAG ATAACGCTTG TGGAAATTCT 
GTAATGGCCT ACGGATTGAA TTGCGACGGA GGGTTCCAGC AATACTTGTT GATCGACAAC 
TTGAGAACGT TATTGCCTAT TCCAGAAGGC ATGAGCTACG AGGACGCTGC TGTTTCTACT 
GATGCCGTCT TGACTCCCTT CCATGCAATT CAGAAAGTCA GAGACTTGCT CCATCCCACC 
ACGAAAGTGT TGGTCCAGGG CTTGGGTGGT CTTGGTTTGA ATGCTGTCCA GATCTTGAAG 
AGCTACAACT GCAATATCGT CGCCTGCGAC ATCAAGGAAG AAAGTAGAGA ATTGGCCAAG 
GGCCTTGGAG CAGCGGAAAC CTACGCCAAC ATCGGGGACT CCAGTCATTC AATAGAGAGC 
TTTGACCTCT GTTTTGACTT TGTCGGTATT GACATCACCT TTAAGAACAG TCAGAGCTAC 
GTAAAAAACC ATGGAAAGAT CGTAATGGTG GGCTTGGGAA GGTACAAGTT GAGCACTTTG 
AACTTCGAGC TCGCAAGAAG AGATGTCGAG ATTATCTTCA ATTTCGGAGG CACTTCTTTG 
GAGCAAATTG AGTGTATGAA GTGGATCTCC TTGGGCAGAA TCAAGCCTGT AGCCCAGGTT 
GTGGACATGG AACAGTTGCC TAACTACATG GAGAAGTTGG CCAACAACGC TATCAAGGGA 
AGAATGGTTT TCAGACCCAA TTTCAGAAAA TCCAATTTGT AG

Protein sequence

MSIPKTQVAY GYVPGKKTIQ CFPNHPVQTP GDNQVLLKIE AAGMCHSDHN ILLSGPLAGG 
KGEPKMVMGH EIAGQIVQVG KNLEKSDIYE IGGRFAVTIA KACGECEMCR GGVDNACGNS 
VMAYGLNCDG GFQQYLLIDN LRTLLPIPEG MSYEDAAVST DAVLTPFHAI QKVRDLLHPT 
TKVLVQGLGG LGLNAVQILK SYNCNIVACD IKEESRELAK GLGAAETYAN IGDSSHSIES 
FDLCFDFVGI DITFKNSQSY VKNHGKIVMV GLGRYKLSTL NFELARRDVE IIFNFGGTSL 
EQIECMKWIS LGRIKPVAQV VDMEQLPNYM EKLANNAIKG RMVFRPNFRK SNL