Gene PICST_90594 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_90594
Symbol	MSC7
ID	4840166
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	-
Start bp	1577837
End bp	1579955
Gene Length	2119 bp
Protein Length	616 aa
Translation table	12
GC content	42%
IMG OID	640391481
Product	Meiotic Sister-Chromatid recombination aldehyde dehydrogenase
Protein accession	XP_001386003
Protein GI	150866411
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.308604
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TAAGTTGTCG TCTACCAATT GAGTAAATAG GAATAGGCGA AACTTCAATT CTTTCTGATA 
GCTGCTTATA TCTTCTAAAC CATTTTGTTA TATTTCTGTA GATCTTCACG AAGTTACTAC 
TACAACCTAA AACCTCGATC GATAGCAACC TCAAACATGA TCTTGTTAGA CTTCAAGTTC 
CACGAATGGC AATGGCAGTA CCAGATTTCG ACAACTTTCT TTGTGTTTGG AATTGTTCCC 
TTTGTCTTCT GGGTTTATGC CCGCTACATC ACAGCTTCAC CTAACAAGTA CAACAAACTT 
GAAGAACCAG TCAAGCTTTC GGTTCCTATT CCTGCCGAGG CCAAACCCCA CTGGAAGGGC 
AAGAGATTGT ACCCTCCAAA CTTGACTATC AGAGCAGCTA ATGAGCCAAC AAAGATTCAG 
AGTTACTGTC CTGCAACTGG CCAGTACTTG GGAACTTTCA CAGCTACAAC CAGAGACGAA 
ATGAACCAAC AAATAGCCAA CGCTAAAGTG GCGCAGAAGG AGTGGAAAGC CTCCAGCTTC 
TCGTTGAGAA GACAAGTGTT GAAAACATTA AGCAGATTCA TTCTCGACAA CCAAGAAGAC 
ATCGCAAGAA TTGCATGTCG AGACAGTGGA AAAACGAAAC TCGACGCTCT GATGGGTGAA 
ATTATGGTAA CCTTAGAAAA GCTCAAATGG ATCATTGCCC ATGGTGAAAG AGTTTTGAGG 
CCTTCGCAAC GTCCAGGACC TTCAAATTTA TTGATCGGAA TGATGAAAAA TGGAGAAGTC 
AGATACGAAC CATTAGGGGT TGTAGCTGCT CTTGTTTCAT GGAATTATCC CTTTCACAAT 
CTCATGGGTC CGATCATCGC GGCCTTGTTT ACTGGAAATG CAATCATAGT TAAATGTTCT 
GAGCAGGTGA TTTGGTCTTC GACATGGTAC ATTGATTTGG TTAGACTTGT GTTGAAGCTG 
CTTGAGATCG ACCCCAATTT GGTACAATTG TGCTGTTGCT ATGCTGAGGA TGCTGACCAT 
TTTACCTCTC ATCCGGGCTT GTCGCATATC ACCTTCATTG GCTCTAAACC TGTGGCCCAT 
AAAGTTGTAG AAAGTGCTTC AAAGGAGCTT ACCCCAGTAG TTGTGGAGCT TGGTGGAAAA 
GATTCGCTTA TTGTTTTGGA TGATGTCAAG GATATCGAGT CATTGTCATC TGTGATATTG 
AGAGGAACTT TCCAGAGCGC AGGTCAGAAC TGTATTGGTG TCGAAAGAGT AATTTGTCTT 
CCAAAGTCGT ACGAGAAATT GGTTGAGATT TTCACCGAGA GAATCAAGGA GTTCCGCTTG 
GGCTCCGATA TCGACCAGCT AGACGAAATC GACATGGGTG CAATGATTTC AGACAATAGA 
TTTAAACAAT TAGAAGCATT GGTGGAAGAT GCTGTCAGTA AAGGAGCGAG ACTAATACAT 
GGTGGGAAAC CATACCAGCA TCCGAACTAT CCTCAGGGCC ACTACTTCGA ACCTACGTTG 
ATTGTGGACG TAGATCCCAG CATGAGAATC TTCCAAGAAG AAGTGTTTGG ACCAGTTCTC 
ACCATGATCA AAGCCAATGA CGTAGACGAT GCCGTCAACT TGGCTAACGG AACCGAATAT 
GGATTGGGTA ACTCTGTCTT TGGCAGCAAC TTCAGGCAAA TCAACGAGAT TGCTAACAGA 
CTTGATAGTG GCAATGTTGC CATAAATGAC TTTGCCACTT TCTATGTAGC ACAGCTTCCA 
TTTGGAGGAA TCAAGAAGTC CGGCTATGGT AAGTTTGGAG GAGAAGAAGG TCTCTTGGGC 
TTATGTGTAG CTAAGTCTGT TGTAATGGAT AAGCCAATCA TGAGACTATT TGGAGTAGCA 
ACAAGCATTC CACCTCCAAT TGATTATCCT ATTAAGGATG ACAAGAGGGC ATGGAAATTT 
GTCCTGAGCT TGAACACTGC TGGTTACGAT ACCAGAGTGT GGAACATCAT CAAAGCATTC 
AAAAAACTCG CAAAGGGGGG AGCATGATAA AGTAAGGAAT ACTATATTTT GATTCATAAA 
TACTTATACA CCACAAAAAC TTCATAATAG ATAGATACAT GGTAAATTGT TATAGATACC 
TATAAAAAAG ATCGTACAG

Protein sequence

MILLDFKFHE WQWQYQISTT FFVFGIVPFV FWVYARYITA SPNKYNKLEE PVKLSVPIPA 
EAKPHWKGKR LYPPNLTIRA ANEPTKIQSY CPATGQYLGT FTATTRDEMN QQIANAKVAQ 
KEWKASSFSL RRQVLKTLSR FILDNQEDIA RIACRDSGKT KLDASMGEIM VTLEKLKWII 
AHGERVLRPS QRPGPSNLLI GMMKNGEVRY EPLGVVAALV SWNYPFHNLM GPIIAALFTG 
NAIIVKCSEQ VIWSSTWYID LVRLVLKSLE IDPNLVQLCC CYAEDADHFT SHPGLSHITF 
IGSKPVAHKV VESASKELTP VVVELGGKDS LIVLDDVKDI ESLSSVILRG TFQSAGQNCI 
GVERVICLPK SYEKLVEIFT ERIKEFRLGS DIDQLDEIDM GAMISDNRFK QLEALVEDAV 
SKGARLIHGG KPYQHPNYPQ GHYFEPTLIV DVDPSMRIFQ EEVFGPVLTM IKANDVDDAV 
NLANGTEYGL GNSVFGSNFR QINEIANRLD SGNVAINDFA TFYVAQLPFG GIKKSGYGKF 
GGEEGLLGLC VAKSVVMDKP IMRLFGVATS IPPPIDYPIK DDKRAWKFVS SLNTAGYDTR 
VWNIIKAFKK LAKGGA