Gene PICST_51733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_51733
Symbol	YHC3
ID	4851198
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	1177086
End bp	1178357
Gene Length	1272 bp
Protein Length	406 aa
Translation table
GC content	43%
IMG OID	640392906
Product	vacuolar CLN3 homolog involved in pH homeostasis
Protein accession	XP_001387870
Protein GI	126274184
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00839539
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCTTAA TAGTACCAGA ATCCACAAAA ATCTTCACTT CCTTCTTTCT CTTTGGACTC 
CTAAACAATA TCCTTTACGT GGTAATCCTA TCTGCCGCTA TTGACTTGGT TGGTGCTGCT 
ACTCCCAAGG CTGTGGTACT ATTGGCTGAT GTTGTCCCAG CTTTTATATT CAAGCTCACT 
GCTCCCTTCT TTATTCATAC GATATCGTAT GTCTCGAGAA TATGGTCTCT CGTAGCACTT 
TCATCTTTGG GAATGTTATT AATCAGCTTG ACTCCTGAAA GTTCCATCGG CGTCAAAGTG 
TTTGGAATAG TTCTAGCTTC GTTTTCCTCG GGGTTTGGAG AAGTTTCGTT TTTGCAATTG 
ACCCACTATT ATAACGAAGA AATGTCGCTA GGAGGCTTTG CTAGTGGGAC TGGAGGTGCT 
GGTCTTTTTG GCAGCTTCTT GTTCATGTTC ATGACAAACA TCTTGGGAAT CAAGGTATGG 
TTAGTACTCT TGCTCTTTGC TTTGGTTCCG CTCGGTTTCC TTGCTACTTT CTACTTGCTC 
CTACCATCAC CTGGACTAAG TGAAAATGTG TATGAACCGA TATTCGACGA GGAAACTCAG 
ATAGACCCAG TGGAAACAGA GTTAGAGTCT TTGGACCGCA TCGACGGCGA ATTATACGAA 
CCTAAGACAT ACAGTCTAGA AAGCTTGAAA CTCCATGTTT CTAAAACTAT AACTCTAATC 
ACACCGCTAG TACTTCCGTA CATGCTACCA TTGAGTTCCG TATATGTTTC AGAGTATGTA 
ATCAACCAGG GAATATCTCC TACCTTATTG TTTCCTTTGG ACGACTTGCC TCATTGGTTG 
TTCTCGACTT ACAGAGATAT TTATGTTGTC TACGGATTCT TGTATCAACT AGGAGTTTTC 
ATTCTGCGGT CCTCGATGAA TTTCGGCATA AGAATCAAAC AGCTATATGC GTTGTCATTG 
CTTCAGTTCG CCAATGTCGT TATTACACTC TACCAGTCTG TTTACGATGC TCCCTTTAGT 
TCCATCTGGC CTCTTATGGG GCTTATTTTC TACGAAGGGC TCCTAGGCGG CTTTCTGTAT 
GTAAACACTT TCATGTCAGT TAGTGAAGAC ATACCCAAGA CTGAACGAGA ATTTTCTATG 
GGATGTGTTT CCATTAGCGA CAGCTTGGGT ATAGTTTTAG CCGGGTGTAT CAACTGGTGG 
CTTGAAACAA AACTTTGCGG CTTGCAAGTG CAAAGGGGCA GGGACTGGTG TCTGAAGGGT 
AGCTCCTTTT AG

Protein sequence

MSLIVPESTK IFTSFFLFGL LNNILYVVIL SAAIDLVGAA TPKAVVLLAD VVPAFIFKLT 
APFFIHTISY VSRIWSLVAL SSLGMLLISL TPESSIGVKV FGIVLASFSS GFGEVSFLQL 
THYYNEEMSL GGFASGTGGA GLFGSFLFMF MTNILGIKVW LVLLLFALVP LGFLATFYLL 
LPSPGLMETE LESLDRIDGE LYEPKTYSLE SLKLHVSKTI TLITPLVLPY MLPLSSVYVS 
EYVINQGISP TLLFPLDDLP HWLFSTYRDI YVVYGFLYQL GVFILRSSMN FGIRIKQLYA 
LSLLQFANVV ITLYQSVYDA PFSSIWPLMG LIFYEGLLGG FLYVNTFMSV SEDIPKTERE 
FSMGCVSISD SLGIVLAGCI NWWLETKLCG LQVQRGRDWC LKGSSF