Gene PICST_74151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_74151
Symbol	YVH1
ID	4841141
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	+
Start bp	707291
End bp	708473
Gene Length	1183 bp
Protein Length	326 aa
Translation table	12
GC content	42%
IMG OID	640392456
Product	nitrogen starvation-induced protein phosphatase
Protein accession	XP_001386543
Protein GI	150866820
COG category	[T] Signal transduction mechanisms
COG ID	[COG2453] Predicted protein-tyrosine phosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.373498
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

AAACCACGAA CAACAATGGT GGTTCGTATT CTTGGAGGAG TATACCTCTC ATCTATAGAG 
CCCATCAACA ATAGCATAGA TTTAAAGACA AAATACAGCA TCTCCCATAT ACTTTCTGTG 
GTTCCAGGTC CTTTACCCCA AGAGTATCTT AAAGACTATG AGCACAAGCA AATCGAAGTC 
ACCGACGAGG AAACGTCGAA TTTACTAGAA TACTTTGATT CAGCCTACGA TTTCATCGAA 
GAAGGTTTGT TTAAAGAGTC GACAGATCCA AAGAAGCACC TGAGATGCGT TCTAGTTCAT 
TGTTCACAAG GAGTATCCCG TTCTGTAACT GTAGTTGTAG CATATCTCAT GAAGAAGTAC 
AATTTGACTT TGGAACAAGC AATGCATGCC GTCACACGGA AGGTGCCAGA AGCACAGCCC 
AACGATGGCT TCATGGAGCA GTTGAAGCTC TACAAGGAAA TGGATTTGAA AGTCGACTCT 
TCGAACGACT TGTACAGAGA ATTCGTCATC AACAACCAAC TTAGCTTAGA TCCTACTGGT 
GCTACATTGA GAGATATGGA CCTTTTCAAA CCAAAACTGC AGCAGCAGCT TCTGGAAGCA 
GATAAAAATT ACGAATTGAG GTGCAAAAGA TGTCGTCAAG TATTGGCCGT TGGTGGTCAG 
ATTGAAAACC ACGAGCATCC TGATGCTGAA TCTCGCCAAT CTCAATTCAT CAAGAAAGCT 
CCTAACTCTC GTAGAATCAT TTCAGTGCAA GAGGCCAGCT CTAACTGTTC GCACCATTTC 
TTGGCTGAAC CCTTGACATG GATGAAAGAA GAACTAGAAA AAGGCGAGTT GGAAGGCAAG 
TTTATGTGCC CAAAGTGTAT TGCAAAGGTA GGGGGCTACA GTTGGAGAGG TTCTAGATGT 
TCGTGTGGAA AATGGATGAT CCCAGCTATA CATTTACAAT CGGCCAAAGT GGATAGTATC 
AAAAACATAG TCTTGCCGAA TCACTCTACA GTATAAATAG ACTTTTAATT AGCTAGCATC 
AACCACCATG TCGACGTACG AGTTGTTTTG ATCGTTGTCT TCGTTTTGAG TGACATCTTC 
GTTTTCATGT CCGATTTCGT TTTCATTTCC GATTTCGTTC TCAATTTCGT TCTCATCCTG 
GTGGTTTTCG TCGATACGAT TTAATGAATA AGCATGAGAA TTC

Protein sequence

MVVRILGGVY LSSIEPINNS IDLKTKYSIS HILSVVPGPL PQEYLKDYEH KQIEVTDEET 
SNLLEYFDSA YDFIEEGLFK ESTDPKKHSR CVLVHCSQGV SRSVTVVVAY LMKKYNLTLE 
QAMHAVTRKV PEAQPNDGFM EQLKLYKEMD LKVDSSNDLY REFVINNQLS LDPTGATLRD 
MDLFKPKSQQ QLSEADKNYE LRCKRCRQVL AVGGQIENHE HPDAESRQSQ FIKKAPNSRR 
IISVQEASSN CSHHFLAEPL TWMKEELEKG ELEGKFMCPK CIAKVGGYSW RGSRCSCGKW 
MIPAIHLQSA KVDSIKNIVL PNHSTV