Gene PICST_47116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_47116
Symbol	AAD5
ID	4839667
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	+
Start bp	1268123
End bp	1269184
Gene Length	1062 bp
Protein Length	353 aa
Translation table	12
GC content	42%
IMG OID	640390982
Product	aryl-alcohol dehydrogenases
Protein accession	XP_001384930
Protein GI	126136813
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGCCT CTCCTGTTCA AAACACAAAA CTCGGTGCTT CTGGATTGTC CATTTCTCCG 
CTTATTGTTG GTTGCATGAC ATTTGGTAAA AAGAAATGGG CCGACTGGGT TATTGAAGAT 
GAAGAAAAGG TCTTCAGCAT TTTGAAGAAG TGCTATGATT CTGGTCTCAG AACATTTGAT 
ACTGCTGATG TCTACTCCAA CGGTCATTCT GAGATCCTCT TGGGGAAGTT CTTGAAGAAG 
TACAACATCC CCAGAGAAAA GGTTGTTATC ATGACCAAGG TGTTTGGTAC CATTGATACC 
AGCTATGAAG ACTTTACTTT CTTCACTGAA ATGGAGAAGC CAGCTTTCGA ATTTGCCAAC 
AACAAGGGAT TGTCTAGAAA ACACGTTTTG GATGCTGTCA AGGGCTCAGT TGAGAGATTA 
GGAACATTCA TCGATGTTTT GCAAATCCAC AGATTGGACA AGGAAACCCC CAAGGCTGAA 
ATTATGAAGT CTTTGAATGA CGTTGTTGTT TCTGGAGATG TCAGATATAT TGGTGCATCT 
TCCATGAAAG CCAGTGAGTT CTGTGAGTTA CAGTACATTG CTGACAAAAA TGGATGGACC 
AAATTCATTA GTATGCAAAA CTTCTACAAC TTGCTTTACC GTGAAGAGGA GCGTGAAATG 
ATTCCATTCT GTAAAAACAA CGATTTGGCT GAAGTTGGAA TAATCCCATG GTCCCCTATT 
GCTACTGGAA TTTTGGCCAG ACCTCTTGGT GCCAAATCTG CAAAGAGTAC TAGAGCCGAT 
ACCGATTGGG CCAAACAATT CACTGGTTTG GACAAGTTAA CTGAAGCTGA CGAGACCATT 
GTTAACAGAG TAGAAGAAAT CGCCAAAAAG CATGATACCA GCATGGCATC TGTTGCTTCT 
GCCTGGGTTT TGAGTAAGGG AGCTCATCCT ATTCTTGGAA TCAACTCTGT TGAGAGAGTT 
GATGATGCCT TGAAGTCGCT CACCTTCAAG TTAACTGCTG AAGAAACTGC CTACTTGGAA 
GAACCATACA AGCCAAAGAA AGTCTACGGT TTGTTTGATT AG

Protein sequence

MSASPVQNTK LGASGLSISP LIVGCMTFGK KKWADWVIED EEKVFSILKK CYDSGLRTFD 
TADVYSNGHS EILLGKFLKK YNIPREKVVI MTKVFGTIDT SYEDFTFFTE MEKPAFEFAN 
NKGLSRKHVL DAVKGSVERL GTFIDVLQIH RLDKETPKAE IMKSLNDVVV SGDVRYIGAS 
SMKASEFCEL QYIADKNGWT KFISMQNFYN LLYREEEREM IPFCKNNDLA EVGIIPWSPI 
ATGILARPLG AKSAKSTRAD TDWAKQFTGL DKLTEADETI VNRVEEIAKK HDTSMASVAS 
AWVLSKGAHP ILGINSVERV DDALKSLTFK LTAEETAYLE EPYKPKKVYG LFD