Gene PICST_74631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_74631
Symbol	TYS1
ID	4851408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	1745010
End bp	1746268
Gene Length	1259 bp
Protein Length	404 aa
Translation table
GC content	47%
IMG OID	640393116
Product	tyrosyl-tRNA synthetase
Protein accession	XP_001387562
Protein GI	126274525
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0162] Tyrosyl-tRNA synthetase
TIGRFAM ID	[TIGR00234] tyrosyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.158279
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CAAGCCCACA AGCCATGTCT GTCGCCACCG ACCCAGAAGA ACAATACAAG CTCATCACCA 
AGGGCCTTCA GGAGGTCTTA AATGGCCAAA TCATCAAGGA TGTCCTTGAA AAGGAGAAGA 
GACCCGTAAA GATCTACTTG GGTACAGCTC CCACTGGGAA GCCCCACTGC GGTTACTTTG 
TGCCCATGAT CAAGTTGGCC CATTTCTTGA AGGCTGGATG TGAAGTGACG GTCCTTTTGG 
CCGACTTGCA CGCCTACTTA GACAACATGA AGGCTCCATT GGAAGTAGTC CAGTACAGAG 
CCAAGTACTA CGAATATGTG ATCAAGGCCA TGTTGAGATC CATCAACGTT CCAATTGACA 
AATTAAGATT TGTAGTAGGC TCTGAATACC AGTTGAGCGC ACAGTACACT ATGGATATCT 
TCAAGTTGCT GAATGTTGTT TCCCAGAACG ATGCCAAGCG TGCTGGTGCT GATGTCGTCA 
AGCAGGTTGC CAACCCATTG TTGTCCGGAT TGATTTACCC ATTGATGCAA GCTCTTGATG 
AAGAACATTT GGGTGTTGAT GCCCAGTTTG GAGGTGTTGA CCAGAGAAAG ATTTTTGTGT 
TGGCCGAAGA GAACTTGCCT TCCGTAGGCT ACAAGAAGAG AGCTCACTTG ATGAACCCTA 
TGGTTCCAGG ATTGGGTCAG GGTGGTAAGA TGTCTGCTTC GGATCCAAAT TCCAAGATTG 
ATATTATTGA AGACCCTAAG GTCGTCAAGA AGAAGGTCAA CAGCGCTTAT TGTGCTCCCG 
GTGACATCAA AGACAACGGC TTGTTGTCGT TTGTAGAATA CGTAGTCCAA CCCATCCAAG 
AATTGTTGGC AGAGCAAGAT GGAGTGTTCA AGTTCGACAT TGACCGTCCG GAAAAGTACG 
GTGGTCCAAT CTCGTACACG TCTCTTGACC AGTTGAAAGC AGACTTCGCT TCTGAAAAGT 
TGTCGCCAGT CGACTTCAAG GCCGGTGTTG CTGACAAGAT CAACGAGTTG TTGGCTCCTA 
TCAAGGCTGA ATTCGATGCC AGCCCTGATT TCCAGGAATA CCAGCAAAAG GGCTACCACC 
AGGAACAGCC AAAGGCTGAA AAGAAGACCA AGAAGGTCAA GAACAAGGGT ACCAGATACC 
CTGGTGCCGG CAAACCAGAT GGTGCTTCTG CTCCAGAAGC TGAAGCTGAA GCTGTTACTG 
CTAAGTTGGA AGAAGCTAAG TTAAATTAGG TATAGATACG TAATAAAGGT AATTTCTAG

Protein sequence

MSVATDPEEQ YKLITKGLQE VLNGQIIKDV LEKEKRPVKI YLGTAPTGKP HCGYFVPMIK 
LAHFLKAGCE VTVLLADLHA YLDNMKAPLE VVQYRAKYYE YVIKAMLRSI NVPIDKLRFV 
VGSEYQLSAQ YTMDIFKLLN VVSQNDAKRA GADVVKQVAN PLLSGLIYPL MQALDEEHLG 
VDAQFGGVDQ RKIFVLAEEN LPSVGYKKRA HLMNPMVPGL GQGGKMSASD PNSKIDIIED 
PKVVKKKVNS AYCAPGDIKD NGLLSFVEYV VQPIQELLAE QDGVFKFDID RPEKYGGPIS 
YTSLDQLKAD FASEKLSPVD FKAGVADKIN ELLAPIKAEF DASPDFQEYQ QKGYHQEQPK 
AEKKTKKVKN KGTRYPGAGK PDGASAPEAE AEAVTAKLEE AKLN