Gene PICST_31908 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31908
Symbol	MSY1
ID	4839467
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	+
Start bp	188251
End bp	189909
Gene Length	1659 bp
Protein Length	552 aa
Translation table	12
GC content	45%
IMG OID	640390782
Product	tyrosyl-tRNA synthetase
Protein accession	XP_001384692
Protein GI	150865466
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0162] Tyrosyl-tRNA synthetase
TIGRFAM ID	[TIGR00234] tyrosyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.483177
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.847897
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGAGGG GAAGAATCGG CGTATTTGTC CAGTGTCGTT CTTTGAGCAG ACTTAGGGCG 
ACCGCAAGGC CCGTTTCTTT TGGCAAACTG TTGAGGTTCA ACTCTTCCAC TATCAAATCA 
GATGTGAATA TTGAACAACT GAAAAATAGT GCTAGCCAGC CAGCTTCTTC AAATACAGAG 
AAGATAGAGG CTCCTGTTGA AGAAGACACT CCTGATACCA TCACCATTGT GCCTGCTCTT 
AAGGAATTGA CCGGCTCAGC AAATTACCAG CCCGATTTAG ATATGCCTCT TGTTGGCCAT 
TTGCAATCAC GGTATCTTGT AGAATCGATA ACCGACGATG CTTTGTTCGA CTTGACTCTG 
CCTGAAAGCA CCAAGAAGTT CAAATTGTAC TGTGGAGCCG ATCCAACTGC CGAATCGCTT 
CATTTGGGTA ATCTCTTGCC ATTGATGGTT CTTCTTCATT TCAACTTGCG TGGCCACGAT 
GTAGTAGGAC TTGTAGGAGG AGCTACTGGT GCTGTAGGAG ATCCCAGTGG CAGAACTACA 
GAAAGATCCC AGATTGAAGA TAAAGAGAGA GAAGATAATG TATCCAAGAT CCAGAAACAA 
TTGGTGACGT TTTTGGAGAA TGGTGTAGCC TATGCCAAAT CGCGTAACTA TCCTATAGCA 
GGAGAAGGAA GGATTTTAAC GGCTAATAAC GCCAGCTGGT GGCTGTCGAT AGGCATGTTA 
GAGTTCCTTG CCAAGTATGG CAGACATATC CGTGTATCTT CAATGCTTGC GCGTGATTCA 
ATTCAGTCTA GATTGAAGGA CCAACATGGT TTAGGATTCA ACGAGTTCAC CTACCAGATC 
TTGCAAGCCT ACGACTTTTG GCACATGTTC CGGGAAGATG GGGTCAACAT GCAGATAGGT 
GGCAATGACC AGTGGGGTAA TATTACCGCT GGTATCGACT TGATCTCACG GTTACAGAGA 
CATTTTGGAA AAGAAGGTGT AGAGCCACAA AGTGCCTATG GTATGACTGT GCCGTTGTTG 
ACTTCTCCCA CGGGGGAAAA GTTTGGCAAA TCGGCTGGGA ATGCTGTTTT CATCGATGAA 
AAGTACACCA CGCCGTACCA GATGTACCAA TACTTCATCA ACAGTCCAGA CGATATGGTT 
GCAAAGTTGC TTAAAACGCT TACATTGTTG CCATTGAGTA TTATAGACGG TTATATCTTG 
CCCAAACACG AATCCGATCC TGGTTTGAGA ATTGCCCAGC GTATCTTGGC TCGTGAAGTT 
GTGGACTTGA TCCATGGTGA GGGTGTCGGT GAAGAGATGG CCTACATCAC CAGTTTCTTA 
TTTCCTACAC CCGATCAGCC ATTCAACGAT ACTGTATCTG CAGATCGGTT GATCCAGAAT 
TTTAGGAGAT CGGGCATTTT GGTGAACTTG AAGTTTTCGG AAATCGAGAA CATCGACGAC 
TTACGTATGA GCAGCTTGTT AGCCCAGATC ACCAACAAGT CCCGTAGAGA AGTGAAGCAG 
TTGATCAAGT CAGGAGGAAT CTACATGGGT TTGGAGAGAG ATCAGTTTGA GGATCCCGAA 
GATGTAGTAT TGTTTGACCG TGATAACCAC TTGATCGACG GCAAGTTACT TCTTGTCAGA 
GTGGGCAAGC AGAATTATTA TGTTGTTGAG TTCAGTTAA

Protein sequence

MLRGRIGVFV QCRSLSRLRA TARPVSFGKS LRFNSSTIKS DVNIEQSKNS ASQPASSNTE 
KIEAPVEEDT PDTITIVPAL KELTGSANYQ PDLDMPLVGH LQSRYLVESI TDDALFDLTS 
PESTKKFKLY CGADPTAESL HLGNLLPLMV LLHFNLRGHD VVGLVGGATG AVGDPSGRTT 
ERSQIEDKER EDNVSKIQKQ LVTFLENGVA YAKSRNYPIA GEGRILTANN ASWWSSIGML 
EFLAKYGRHI RVSSMLARDS IQSRLKDQHG LGFNEFTYQI LQAYDFWHMF REDGVNMQIG 
GNDQWGNITA GIDLISRLQR HFGKEGVEPQ SAYGMTVPLL TSPTGEKFGK SAGNAVFIDE 
KYTTPYQMYQ YFINSPDDMV AKLLKTLTLL PLSIIDGYIL PKHESDPGLR IAQRILAREV 
VDLIHGEGVG EEMAYITSFL FPTPDQPFND TVSADRLIQN FRRSGILVNL KFSEIENIDD 
LRMSSLLAQI TNKSRREVKQ LIKSGGIYMG LERDQFEDPE DVVLFDRDNH LIDGKLLLVR 
VGKQNYYVVE FS