Gene PICST_38391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_38391
Symbol	IFD4
ID	4851277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	1391164
End bp	1392222
Gene Length	1059 bp
Protein Length	352 aa
Translation table
GC content	41%
IMG OID	640392985
Product	aryl-alcohol dehydrogenase (AAD4)
Protein accession	XP_001387911
Protein GI	126274263
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.142072
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.861944
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTCTT CAATTGAATA CAAAAAGCTT GGTGCCTCTG GTTTGGCTAT TTCTCCTATC 
ATTGTGGGAT GCATGTCCTA CGGTAAGAAA GTTTGGGCCG ACTGGGTAAT GGAAGATGAA 
GAACAGATCT TCAAAATCTT GAAAAAGTGC TACGACTCTG GTATTAGAAC TTTTGATACT 
GCTGACTTGT ACTCCAATGG TCAATCGGAA GTTATCTTGG GTAAGTTTTT GAAGAAGTAC 
AATATTCAAA GAGAGAAAGT GGTAATTTTA ACGAAGTGCT TCTGTCTAAT TGACACAAGT 
ATCCCTGATT TAAACCCTGT AACACAATAC GATTATCCAT CCTATGAGTT TGTCCATAAC 
CAAGGTTTGT CGAGAAAGCA TATTTTCGAT GCCGTCAAAG GTTCAGTTGA AAGATTGGGA 
ACCTACATTG ATGTCTTGCA AATTCACAGA TTGGATAAGT CGACTCCAAA GGCTGAAATC 
ATGAAAGCTT TGAACGACGT AGTTTCTAAT GGTGATGTCA GGTATATCGG TGCTTCTTCT 
ATGAGAGCCG CTGATTTCGT TGAATTGCAA TTCATTGCTG ATAAGAATGG CTGGACTAAG 
TTCATCAGTA TGCAAAACTT CTACAACTTA ATCTACCGTG AGGAAGAGAG AGAAATGATT 
CCTTTCTGTA ACGATAACTC CCTTGGTAAG GTTGGCTTGA TTCCATGGTC TCCAATTGCC 
AGAGGTCTTT TGGCTAGACC TCTTGGTGTA GAATCTGACC ATAACAGATC TGTCGACACT 
GACTTGGCAA TAGAGTTCTT TGGTTTGGCA AACTTGACTG AGGCCGACAA GGAAATTATC 
AAGAGAGTTG AAGAAGTTGC CAAAAAGCAT GAGGTTAGTA TGGCTGTAAT CTCCTCTGCT 
TGGGTTTTGA GCAAGGGTGC CTTCCCTATC ATCGGTCTCA ACTCTGAAGC AAGAGTTGAC 
GATGCAATCA AGTCTCTCGC TGTTAAGCTA ACTGATGAAG AAGTCGCATA CTTGGAAGAA 
CCTTACAAAC CTAAGCCAGT ATACGGTTTG CTTGATTAG

Protein sequence

MSSSIEYKKL GASGLAISPI IVGCMSYGKK VWADWVMEDE EQIFKILKKC YDSGIRTFDT 
ADLYSNGQSE VILGKFLKKY NIQREKVVIL TKCFCLIDTS IPDLNPVTQY DYPSYEFVHN 
QGLSRKHIFD AVKGSVERLG TYIDVLQIHR LDKSTPKAEI MKALNDVVSN GDVRYIGASS 
MRAADFVELQ FIADKNGWTK FISMQNFYNL IYREEEREMI PFCNDNSLGK VGLIPWSPIA 
RGLLARPLGV ESDHNRSVDT DLAIEFFGLA NLTEADKEII KRVEEVAKKH EVSMAVISSA 
WVLSKGAFPI IGLNSEARVD DAIKSLAVKL TDEEVAYLEE PYKPKPVYGL LD