Gene PICST_69669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_69669
Symbol	TRP5
ID	4851612
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	2334859
End bp	2337079
Gene Length	2221 bp
Protein Length	700 aa
Translation table
GC content	44%
IMG OID	640393320
Product	tryptophan synthetase
Protein accession	XP_001387018
Protein GI	126275035
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain [COG0159] Tryptophan synthase alpha chain
TIGRFAM ID	[TIGR00262] tryptophan synthase, alpha subunit [TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.390453
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.887683
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGCTT TATTGAAAGA AACTTTTGCT AGGTGTAAAA AAGAGGGACG AAATGCTTTG 
GTCAACTTCA TTACTGCTGG TTACCCTACT ATTGAGGACA CAGTTCCAAT CTTGAAGAGC 
ATGCAAGATG CCGGTGTAGA CATCATTGAA TTGGGTATCC CATTCTCCGA CCCAATTGCT 
GATGGTCCAA CCATCCAAGC TGCTAATAAT GTCGCGTTGG ACAACGGAAT CACCGTCCCA 
AAGTGCTTGG ACTTGGTCAA GCAAGCAAGA GAACAAGGTG TCACTGTTCC AATCATATTG 
ATGGGTTACT ACAATCCAAT CTTAAAGTAC GGTGAAATCA AGTTGATTGA GGACTCTGCA 
AGGGTAGGTG CTAACGGTTT CATTGTCGTC GACTTGCCTC CTGAGGAAGC CATCAAGTTC 
AGATCGTCTT GTGCACGTTA TGGATTGTCT TATGTTCCTT TGGTTGCCCC TGCCACTACT 
GATGAAAGAT TGAAGGTCTT GGGAGAAATC GCAGATTCCT TTATCTACGT AGTTTCTAAG 
ATGGGTACCA CTGGTGCTTC CAAATCTGTT TCTTCCGGTA TCACTGAGTT GTGTGCTAGA 
GTTAGAAAAT TTGCCGGCTC TACCCCAATT GCCGTAGGTT TCGGTGTGTC TACAAGAGAG 
CATTTCTTAA CTGTTGGTGA GAGCGCTGAT GGTGTGGTTA TTGGTTCTAG AATCGTGACC 
TTAATTGGTG AATCTAAGCC AGGTGAAAGA GGTGTGACCG CTTACAAGTA TGTCAAATCC 
ATTTTAGGTG AAGGCTTTTC CGTCAATGCG CCAACTTCTT TCTCTCGGGC TGTAGTTATA 
GATGGAACTG AAACTAAGCC AGTTCTTGAA GAGGACCACA AGTTCAACCC AAAATTTGGT 
GAATTTGGTG GTCAATATGT TCCTGAAGCA TTGCACACTT GTTTGGCTGA ATTGGAGAAA 
GGATTTGAAA GCGCAGTTGC TGATCCCGAG TTCTGGAAGG AATTCAAGGA CTTGTACTCT 
TACATTGGAA GACCATCTTC TTTGCATAGG GCCGAAAGAT TGACTGAATA TGCCGGAGGC 
GCTCAGATCT GGTTGAAGAG AGAAGATTTG AACCATACTG GTTCTCACAA GATCAACAAT 
GCCTTGGCTC AAGTGTTAAT TGCTAAGAGA TTAGGTAAGA AGAAGATTAT TGCTGAGACT 
GGTGCTGGTC AGCATGGTGT TGCTACTGCT ACTGCATGTG CTAAGTTTGG ATTGGAATGT 
ACCGTTTTCA TGGGAGCCGA AGATGTAAGA CGTCAAGCCT TGAATGTGTT CAGAATGAGA 
ATCTTGGGTG CAAAGGTTGT TGCTGTCACT AATGGTACCC AAACATTGAG AGATGCGACT 
TCTGAAGCCT TCAGATTCTG GGTATCAAAC TTAGAGTCAA CGCACTATGT TGTCGGTTCA 
GCAATTGGAC CACATCCATA CCCAACCTTG GTTAGAACCT TCCAAAGTGT TATTGGTCAA 
GAAACCAAAG AGCAGTTTAA GACTTTAAAC GGCGGTAAGT TACCAAACGC CGTTGTTGCT 
TGTGTCGGCG GTGGTTCGAA CTCCACTGGT ATGTTCTCTC CTTTTGAACA CGATACTGAA 
GTCAAAATGT TAGGTGTCGA AGCTGGTGGT GACGGCTTAG ACACTGATCG CCATTCTGCA 
ACTTTGACGG CAGGTATTCC AGGTGTGTTC CATGGTGTCA AAACTTACGT TCTTCAGGAC 
AGTGATGGAC AGGTTCATGA CACTCATTCA GTTTCTGCGG GTTTAGACTA TCCTGGCGTA 
GGTCCAGAAT TGGCATTTTG GAAGAGCACT GGTCGTGCTG ACTTCGTTGC TGCTACAGAT 
GCTCAGGCAT TGATCGGATT TAAATTATTG TCCCAATTGG AGGGTATAAT TCCAGCTTTG 
GAGTCTTCTC ACGCTATTTA TGGTGGTGTT GAGTTGGCTA AGACTATGCC AAAGGATCAA 
CACATTGTTA TCAATGTTTC AGGACGTGGT GACAAGGATG TGCAAAGTGT TGCCGAAGTT 
TTACCGAAGT TAGGCGAGCA GATTGGCTGG GACTTGAGAT TCGAAGCCGA TCCTACGAAG 
TAAGTTTAGT TAATACTAAG AAATTCTATA TTTTTTATAA CCTCTAATAA CAATGCTTGG 
ATGATTTTAC AATTCTTCAG CCATGTTCAT GATTAACAAG ATTGTTGATG TCCAACCCAA 
G

Protein sequence

MSALLKETFA RCKKEGRNAL VNFITAGYPT IEDTVPILKS MQDAGVDIIE LGIPFSDPIA 
DGPTIQAANN VALDNGITVP KCLDLVKQAR EQGVTVPIIL MGYYNPILKY GEIKLIEDSA 
RVGANGFIVV DLPPEEAIKF RSSCARYGLS YVPLVAPATT DERLKVLGEI ADSFIYVVSK 
MGTTGASKSV SSGITELCAR VRKFAGSTPI AVGFGVSTRE HFLTVGESAD GVVIGSRIVT 
LIGESKPGER GVTAYKYVKS ILGEGFSVNA PTSFSRAVVI DGTETKPVLE EDHKFNPKFG 
EFGGQYVPEA LHTCLAELEK GFESAVADPE FWKEFKDLYS YIGRPSSLHR AERLTEYAGG 
AQIWLKREDL NHTGSHKINN ALAQVLIAKR LGKKKIIAET GAGQHGVATA TACAKFGLEC 
TVFMGAEDVR RQALNVFRMR ILGAKVVAVT NGTQTLRDAT SEAFRFWVSN LESTHYVVGS 
AIGPHPYPTL VRTFQSVIGQ ETKEQFKTLN GGKLPNAVVA CVGGGSNSTG MFSPFEHDTE 
VKMLGVEAGG DGLDTDRHSA TLTAGIPGVF HGVKTYVLQD SDGQVHDTHS VSAGLDYPGV 
GPELAFWKST GRADFVAATD AQALIGFKLL SQLEGIIPAL ESSHAIYGGV ELAKTMPKDQ 
HIVINVSGRG DKDVQSVAEV LPKLGEQIGW DLRFEADPTK