Gene PICST_37376 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_37376
Symbol	AAD2
ID	4851559
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	2136636
End bp	2137700
Gene Length	1065 bp
Protein Length	354 aa
Translation table
GC content	42%
IMG OID	640393267
Product	aryl-alcohol dehydrogenases
Protein accession	XP_001387652
Protein GI	126274855
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.485365
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0942071
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTCTT CAATTGAATA CAAAAAGCTT GGTGCCTCTG GTTTGGCTAT TTCTCCTATC 
ATCGTGGGAT GCATGTCCTA CGGTAAGAAA TTTTGGGCCG ACTGGGTTAT GGAAGATGAA 
GAACAGATCT TCAAAATCTT GAAGAAGTGC TACGACTCTG GTATTAGAAC TTTTGATACT 
GCTGACTTGT ACTCCAATGG TCATTCGGAA GTTATCTTGG GTAAGTTCTT GAAGAAGTAC 
AATATTCCAA GAGAGAAAGT TGTAATTTTA ACTAAGTGCT TCTGTCTAAT TGACACAAAT 
ATCCCTGATT TAAACATCGA AACGCAATAC AATTACCCAT CCTATGAGTT TGTTCATAAC 
CAGGGTTTGT CAAGAAAGCA TATTTTCGAT GCCGTCAAAG GTTCAGTTGA AAGATTGGGA 
ACCTACATCG ATGTCTTGCA AATTCACAGA TTGGATGAGG AGACCCCAAA GGCTGAAATT 
ATGAGAGCCT TGCACGATGT CGTTTCTAGT GGTGATGTCA GGTATATCGG TGCTTCCTCT 
ATGAGAGCCG CTGACTTCGT TGAATTACAG TTCATTGCTG ATAAGAATGG CTGGACTAAG 
TTCATCAGTA TGCAAAACTT CTACAACTTA ATCTACCGTG AGGAAGAAAG AGAAATGATT 
CCTTTCTGTA ACGATAACTC CCTTGGTAAG GTTGGCTTGA TCCCATGGTC TCCAATTGCC 
AGAGGACTTT TGGCTAGACC TCTTGGTGTA GAGTCTAACC ATAACAGATC TGCCGACACT 
GACTTGGCAT TTGAGTTCTT TGGTTTGGCA AACTTGACTG AAGCCGACAA GGAGATTATC 
AAGAGAGTCG AAGAAGTTGC CAAAAAGCAT GAAGTCAGTA TGGCTGTAAT CTCCTCTGCT 
TGGGTCTTGA GCAAGGGTGC GTTCCCTATC ATCGGTCTCA ACTCCGAAGC AAGAGTTGAC 
GATGCACTTA ACTCTCTCAC TGTTAAGTTA ACTGATGAAG AAGTCGCATA CTTGGAAGAG 
CCTTACAAAC CTAAGCCAGT ATATGGTTTT CAACATTTTA AGTGA

Protein sequence

MSSSIEYKKL GASGLAISPI IVGCMSYGKK FWADWVMEDE EQIFKILKKC YDSGIRTFDT 
ADLYSNGHSE VILGKFLKKY NIPREKVVIL TKCFCLIDTN IPDLNIETQY NYPSYEFVHN 
QGLSRKHIFD AVKGSVERLG TYIDVLQIHR LDEETPKAEI MRALHDVVSS GDVRYIGASS 
MRAADFVELQ FIADKNGWTK FISMQNFYNL IYREEEREMI PFCNDNSLGK VGLIPWSPIA 
RGLLARPLGV ESNHNRSADT DLAFEFFGLA NLTEADKEII KRVEEVAKKH EVSMAVISSA 
WVLSKGAFPI IGLNSEARVD DALNSLTVKL TDEEVAYLEE PYKPKPVYGF QHFK