Gene PICST_30734 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_30734
Symbol	CYK2
ID	4837877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	805268
End bp	806446
Gene Length	1179 bp
Protein Length	392 aa
Translation table	12
GC content	47%
IMG OID	640389192
Product	cysteine synthase (O-acetylserine sulfhydrylase) (O-acetylserine (Thiol)-lyase) (CSase)
Protein accession	XP_001383788
Protein GI	150864811
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.207324
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTCA ACTGGAAAAT TATACTTCAG TCATCAGCTT CTATAGTTTC AGCGCTTATA 
ATTCTACGTG AACTCCATCG CCAGCTCTCG CAATCGAACA ATTCTTCAAC AAAACTTACA 
TCTCTCCCTC CTCGCTCAAG AGGAGTAGAG TCCCTCATAG GAAACACTCC GCTCATAGAA 
ATCAAGTCTC TTTCTAAACT AACCGGCTGC AAAATCTACG CGAAGCTCGA ACTCGCTAAT 
CCTGCTGGCT CCGCCAAAGA TCGTGTCGCT TTGGCTATCA TCCGGGCCAA CGAAAAACTC 
GGACACCTTC GCCCACACTC CGGGGACGTT ATCTTTGAAG GTACTTCTGG TTCCACTGGC 
ATCTCCTTCG CTGTACTCGC CAACGCTCTC GGATATGATG CTCACATATG CCTCCCAGAT 
GACACTTCTC CTGAAAAATT GCAACTCCTC AAGTCACTCG GCGCTACCAT TCATCCAGTC 
AAACCGGCTT CCATTGTAGA CCCACAGCAG TATACCAATG CAGCACGGTG TGGCTCACAG 
CAGATCAACG AAGACCCTAA CGACAGGCGC AGGGCCATCT TTGCGGACCA GTTTGAGAAC 
GATTTTAACT GGAGAATACA TTACGAGACA ACGGGCCCAG AGATCTGGCG CCAGATGGAA 
CAAGACGTAG ATGTGTTTAT CAATGGCTCC GGAACTGGAG GTACTATAGC TGGAGTATCT 
AAATACTTAC ACGAGCAGAA TAGAGAGATA AAGATCATAC TAGCAGATCC CCAGGGCTCG 
GGATTGGCCA ACAGAGTCAA CTACGGAGTT ATGTACGATA CTGTAGAGAA AGAAGGAACT 
AGACGTCGAC ACCAGGTAGA CACGTTAGTG GAAGGTATTG GTCTTAACAG ACTTACATGG 
AACTTCAAAC AGGCCGAAGC CCATATTACA GAGGCTATAA GGGTGTCAGA CAATCAGGCA 
CTTCGTATGG CAAAGTTCTT GTGTATCAAC GATGGGCTAT TCTGGGGTTC GTCTGCTGCT 
ATAAACTGTG TTGCAGCCGT GAAGACAGCA TTGAAGAATG GACCAGGTCA AAAAATTGTA 
GTGATCGCAT GTGATCTGGG GGCTAGACAT TTGCTGAAGT TCTGGAAACT GGCGGCTGAG 
GTGCCTAATG ATATTACCTT GGATGAAGTT TTACAATAG

Protein sequence

MSFNWKIILQ SSASIVSALI ILRELHRQLS QSNNSSTKLT SLPPRSRGVE SLIGNTPLIE 
IKSLSKLTGC KIYAKLELAN PAGSAKDRVA LAIIRANEKL GHLRPHSGDV IFEGTSGSTG 
ISFAVLANAL GYDAHICLPD DTSPEKLQLL KSLGATIHPV KPASIVDPQQ YTNAARCGSQ 
QINEDPNDRR RAIFADQFEN DFNWRIHYET TGPEIWRQME QDVDVFINGS GTGGTIAGVS 
KYLHEQNREI KIILADPQGS GLANRVNYGV MYDTVEKEGT RRRHQVDTLV EGIGLNRLTW 
NFKQAEAHIT EAIRVSDNQA LRMAKFLCIN DGLFWGSSAA INCVAAVKTA LKNGPGQKIV 
VIACDSGARH LSKFWKSAAE VPNDITLDEV LQ