Gene PICST_74130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_74130
Symbol	GLY1
ID	4841071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	+
Start bp	396387
End bp	397591
Gene Length	1205 bp
Protein Length	369 aa
Translation table	12
GC content	43%
IMG OID	640392386
Product	threonine aldolase
Protein accession	XP_001386466
Protein GI	126139888
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2008] Threonine aldolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TAACATACCC TAATGGACTT CTCAACTTAT ACCGCCCAGA GTCCGGCCCA TAACGAATTC 
CGTAGTGACA CTTTCACCAC GCCAACGGCT TCCATGATCC AGGCATTGGC CAATGCAACC 
TTGGGAGACG CCGTCTATAA CGAAGACGAA TCTACCATTG CCTTGGAGAA AAAGGTAGCC 
GATTTGGCTG GAAAAGAAGC CGGCTTGTAT TGTGTTAGTG GAACTCTCTC CAACCAAATT 
GCCCTTAGAA CAAACCTCAT CCAGCCTCCA TTCAGCATCT TGTGTGACCA CAGGGGCCAT 
GTCTATGTCC ACGAAGCGGG TGGATTGTCC ACCTTATCAC AGGCTATGGT TCAGCCGATC 
GTGGCCAAGA ATGGACATCA TTTGACGTTG GAAGATGACA TTTTGCCCAA CTTCATTCCT 
GACGACGGAG AAATCCATGG AGCTCCAACG AAGGTCATTT CTTTGGAAAA CACCTTACAT 
GGTATGATTT TCCCCTTGGA TGAAATCAAG AAAATCTCTA ACTTCTGCAA GAAGAACGAC 
GTAAAATTGC ATCTTGACGG TGCCAGATTG TGGAATGCGT CTGTTGCCAC TGGAATTTCT 
CTCAAAGAAT ACTGTTCATA TTTCGACAGT GTCTCATTAT GTCTTTCCAA GACTTTGGGT 
GCTCCTGTTG GCTCTGTTCT AGTGTCAACC AGAAAATTTG TAAACAAAGC TAACCACTTT 
AAGAAACAAA ACGGTGGTGG AATCAGACAA AGTGGTTTGT TGGCTGTAAT GGCCATCACA 
GCCATCGACG AGAACTTGCC TAAATTGCAA AAGACCCATG AAAGAGCCAA AGAGTTAGGT 
GAATTGTGTG ACAAGAATGG AATCTACTTG GAACATCCCG TCGAAACAAA CTTCGTGTTT 
ATCGACACGA AGAAAAACAA ATGGAACCCG GAGTCCATAA AGACATTAGC AGAGAAGCAC 
GGAATTAAGT TTTACGGAGG AAGAATATCT TTCCACTATC AAGTTTCTGA CGAAAGCTTT 
GAAGCCGTTA AGAAATTTGT ATTGGAAACG CAGGAAGATG CTAAGAAAAA CCCATACGAC 
GGCGGCGATC AGGTCAGATT TTACAGTAAT ATCGAAGAGT GATTGCAAAG TAAGATGATT 
TACATACCCT ATAATATGTA TAATTAACTA AGTTATATAG ACATTATATA CGTATATTAA 
TATGT

Protein sequence

MDFSTYTAQS PAHNEFRSDT FTTPTASMIQ ALANATLGDA VYNEDESTIA LEKKVADLAG 
KEAGLYCVSG TLSNQIALRT NLIQPPFSIL CDHRGHVYVH EAGGLSTLSQ AMVQPIVAKN 
GHHLTLEDDI LPNFIPDDGE IHGAPTKVIS LENTLHGMIF PLDEIKKISN FCKKNDVKLH 
LDGARLWNAS VATGISLKEY CSYFDSVSLC LSKTLGAPVG SVLVSTRKFV NKANHFKKQN 
GGGIRQSGLL AVMAITAIDE NLPKLQKTHE RAKELGELCD KNGIYLEHPV ETNFVFIDTK 
KNKWNPESIK TLAEKHGIKF YGGRISFHYQ VSDESFEAVK KFVLETQEDA KKNPYDGGDQ 
VRFYSNIEE