Gene PICST_60847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_60847
Symbol	ALD3
ID	4839190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	+
Start bp	26625
End bp	28058
Gene Length	1434 bp
Protein Length	477 aa
Translation table	12
GC content	42%
IMG OID	640390505
Product	mitochondrial aldehyde dehydrogenase
Protein accession	XP_001384658
Protein GI	126136269
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.858717
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGCTA TTAGTAGAAC ATTCCCCAGT ATTATCGAGG GAAAGGATTT CCACAGCAAT 
GAAAAACATC CAGTATACTC CCATGTCACC CAGAAAGAAG CAATCCACTA TTTCTCCTAC 
TTAACTGATA TCAAGAAGGC AGTTTCGAAA ATCGCTGCTG ATGCTGACGA AGGGTTTGAA 
GAATGGTCGT CCATGGCCTA TCAAGAAAGA GTGAAGATTT TCGAGAAGGC TGCTGCTTTA 
CTTGCTGAAA GAAGAGAAGA GTTGATAGCT TCTCACAAAA ATATCGGAGG TCCTACCTGG 
TTTTCCCATG TGAATGCTGA TGAAATCATC TCGCAATTGA AGGAATATAC TTCACTTCTC 
TCTAGACCTA CTGGTTTAGT AGCCCAATCT GCTCATTCTG ATCTCGCACT CGTCGTCAAG 
CAGCCACTAG GTCCTGTCCT CGCCATTGCT CCCTGGAACG CTCCTGTTCT TTTGGCAGGT 
AGAGCCATAG TGGCTCCGTT GGCTGCGGGC TGTTCGGTCA TCCTAAAAGC TTCTGAAAAG 
GCTCCAGAAT CCGCATACCT TGTTGTGAAG ACCTTCATTG ATGCTGGTAT CCCGTCAAAA 
GCATTGCAAT TGGTCTTCAT CAAACCAGAT GACAATCCAG AATTCATCAA CTCCATCTTG 
GACACTGGTT TGATCAAAAA GGTCAACTTC ACTGGCTCTA CAATCGTGGG CAAGAAGATC 
GCTGAAGCTG CCAGTAAACA CTTAGTACCA TATCTTATGG AATTAGGCGG AAAGAATGTG 
TCTATTGTTG AAAAGGATGC TGACTTGGTG AGGGCCGTTG AAACTATAAT CTGGAGTTCG 
TGGTCGCACA AAGGTCAAAT ATGCATGAGT ACTGACAAGG TCTTCGTTGA TGAAAGCATC 
TACGACAAAT TCGTTGCTCA ATTAAAAGTA TCCGCCAATG AGATCGTCAA GGACCCCGAC 
TACGCAATTT CTCAAAGAGA TATTACATTC AAGAGAAACC TTGTTAAGTT GGTTAAGAAT 
GCATTAGATT TGGGTGCAAA TTTGATATTT GGTAAATTAA ATGACCATTT GGACAGCGGT 
TCCTTCAGTC CATTGATCTT GGAAAATGTC ACTTCAAACA TGTTGCTTGA TTCTACCGAA 
TCATTCGGAC CTTTGTTCGC TGTATATAAG TATTCAGATA CAATCAAACT TGTCAAGGAA 
TTAAACAGAG CTGATTATGG ATTGAAGGCC TCAATTTGGT CCCAAAATGT TTTGCAAGCA 
TTGGAAACAG CTAAAAAAAT CCACGTAGGT GGTGTACATA TCAATAGTTC TACGATTCAC 
GACGAAGCGA CTCTACCACA TGGCGGTGTT AAGTCAAGTG GTGCTGGAAG ATTCAACTCC 
ATATGGGGTA TTGACGATTT TTCCATTACC AAGACAATTA CTCTTAGTCA GTAA

Protein sequence

MSAISRTFPS IIEGKDFHSN EKHPVYSHVT QKEAIHYFSY LTDIKKAVSK IAADADEGFE 
EWSSMAYQER VKIFEKAAAL LAERREELIA SHKNIGGPTW FSHVNADEII SQLKEYTSLL 
SRPTGLVAQS AHSDLALVVK QPLGPVLAIA PWNAPVLLAG RAIVAPLAAG CSVILKASEK 
APESAYLVVK TFIDAGIPSK ALQLVFIKPD DNPEFINSIL DTGLIKKVNF TGSTIVGKKI 
AEAASKHLVP YLMELGGKNV SIVEKDADLV RAVETIIWSS WSHKGQICMS TDKVFVDESI 
YDKFVAQLKV SANEIVKDPD YAISQRDITF KRNLVKLVKN ALDLGANLIF GKLNDHLDSG 
SFSPLILENV TSNMLLDSTE SFGPLFAVYK YSDTIKLVKE LNRADYGLKA SIWSQNVLQA 
LETAKKIHVG GVHINSSTIH DEATLPHGGV KSSGAGRFNS IWGIDDFSIT KTITLSQ