Gene PICST_31312 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31312
Symbol	ADH5
ID	4839054
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	490204
End bp	491319
Gene Length	1116 bp
Protein Length	371 aa
Translation table	12
GC content	46%
IMG OID	640390369
Product	NAD/NADP dependent alcohol dehydrogenase
Protein accession	XP_001384388
Protein GI	126135728
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGTTC AAGAAACTAC TATCCCAGCC ACATTCCAAG GTTTTGGAGT TGACAAGCCA 
GAAAACTGGA ACAAGCCCAA GTTGGTGGAA TACAAGAGAA AAATCGTCAA CCCACACGAT 
GTTGTTGTCA AGAACATTGC CTGTGGTCTT TGTGGTTCCG ACATTCTTAC CTTGAAAGCC 
GATTGGTCCC CATTGCTCAG AAACGATGCT GTCGTAGGTC ACGAAATTAT TGGCCATGTC 
ATCGCCATTG GTGATAAAGT TACCCAAGTC AAGATTGGCG ACAGAGTCGG TATTGGTGCA 
GCTTCCAACT CCTGTAGAGA TTGTTCCAGA TGTACCCACG ACAACGAGCA ATACTGTGCC 
GACGGTGCTG GTACTTACAA CTCGGTAGAT GCTGCTGCTG AAGACTACAT CACCCAAGGT 
GGTTACTCTT CCCACTCCAT TGCTAACGAA CAATTCGTAT TCCCTATTCC AGAAGCTATG 
GAAACCGTAC ATGCAGCTCC TTTGATGTGT GCTGGTTTGA CTGTCTACTC TCCATTGGTA 
CGTAACCTTG GTACCGATGC CAAGGGAAAG ACGGTTGGTA TCATTGGTAT TGGTGGTCTT 
GGACATCTCG CCCTTCAATT TGCCAACGCC CTTGGTGCCA ATGTTGTTGC CTTTTCTAGA 
ACTTCTTCAA AGAAGGAACA AGCTCTCAAG TTGGGAGCTC ATGAATTCAT TGCTACTGCT 
GAAGAAAAGG ACTGGAAGAA GAAGTATGCC GACCACTTCG ACTTGATCTT GAACTGTGCT 
TCTGGTATCG ACGGTTTGGT TCTTGACAAC TACTTACAAG TATTGAAGGT CGACAAGAAG 
TTTGTCTCTG TGGGTTTACC ACCAACCAAG GACAACATCC AAGTGTCTCC ACACACCTTC 
CTCCACCAAG GTGCATCTTT TGGTTCGTCT TTGTTAGGAT CTAAGACTGA GGCTTTGCAG 
ATGTTGGAAT TGGCTACTGC AAAGGGTGTC AAGCCATGGG TTGAGGAAAT CCAAATTGGT 
GAAGACGGCT GTCACGAAGC GTTGACTAGA TGTGACAAGG GTGACATTAG ATACAGATTC 
GTGTTCACCG GTTTTGACAA GGCTTTCACT GCCTAA

Protein sequence

MTVQETTIPA TFQGFGVDKP ENWNKPKLVE YKRKIVNPHD VVVKNIACGL CGSDILTLKA 
DWSPLLRNDA VVGHEIIGHV IAIGDKVTQV KIGDRVGIGA ASNSCRDCSR CTHDNEQYCA 
DGAGTYNSVD AAAEDYITQG GYSSHSIANE QFVFPIPEAM ETVHAAPLMC AGLTVYSPLV 
RNLGTDAKGK TVGIIGIGGL GHLALQFANA LGANVVAFSR TSSKKEQALK LGAHEFIATA 
EEKDWKKKYA DHFDLILNCA SGIDGLVLDN YLQVLKVDKK FVSVGLPPTK DNIQVSPHTF 
LHQGASFGSS LLGSKTEALQ MLELATAKGV KPWVEEIQIG EDGCHEALTR CDKGDIRYRF 
VFTGFDKAFT A