Gene PICST_80500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_80500
Symbol	VPS29
ID	4850972
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	597943
End bp	599146
Gene Length	1204 bp
Protein Length	249 aa
Translation table
GC content	39%
IMG OID	640392680
Product	protein involved in endosome to golgi protein transport
Protein accession	XP_001387345
Protein GI	126273933
COG category	[R] General function prediction only
COG ID	[COG0622] Predicted phosphoesterase
TIGRFAM ID	[TIGR00040] phosphoesterase, MJ0936 family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0205498
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CTTTATCTCA TTCTTCATGC TTACATTAGC CATTGGTGAT CTCTACATTC CTGAGCGAGC 
TCTCGATTTG CCGGCCAAAT TCCGCAAGTT GTTGTGCCCC AATCCTCAAA GTATCCCTAC 
CAATAGTAAA ATATCTGAGG TGATATGTCT TGGGAACATC ACCAATTCTG TTGATACGTT 
GAAGTTTTTG CATGATTTAT CACCTTCGTT GCATTTAGTG AAAGGTGAGT TTGACGACTT 
GCCAATATTG TCACAGCAGT TGTCGCTGGT GAGCAAGAAA GATGAGAATG TTGGTATATA 
TGGGGTAATA ACTCATGATA ACTTGAGAAT CGGATTCACC AACGGCTACC AGGTAGTACC 
CAAGAACGAC CCGTTGGCAT TGCTGACGTT GGCGAGAGAA TTGGATGTAG ATGTATTGAT 
TTGGGGAGGA ACTCACAAAG TAGAAGCATA TACCTTAGAT GGCAAGTTCT TCGTGAATCC 
TGGAAGCGGA ACGGGTGCTT TCAGTTTTGA TTGGCCCGAA TGGTACGAAG AAGAAGAGAA 
CGCAAAGGAA GAAGAAATAA AGGAAAATGA AGACGAGGCA AAGCCAGAAG TAAACGAGGA 
AGAAAAAGAA GAACCTACTG TGGAAACGAA AGAAGAAAAG AAAGATGAAA CTGAGGATGT 
AGAAAAGAAA GACGCAGAAG TTACAGAAGT TTCAGAAAAC AAAGCAAATC TATTCGATGA 
AGGACAAACG GAAACTGATG CACAAGATAC ACATGGTGAT CCTTTACTGG ATACCAGGGC 
CAATGTAATA GACGAACACA TCTTAAGTGA AGTTACCGAG CTCAATGCCA TAGTTCCGTC 
TTTCTGTCTT CTTGATACTT TTGGATCTAC TTGTACTTTG TATATCTACA CACATTTGAA 
CGGCGAGGTT AAAGTGGACA AAGTGTCCTA CACTAAGGAA TAAGATGCTT GCACAACGAA 
TTCCGGGTAC TAGTGTTGTA AATGCCTAAA ACTATTTACG CAACTATTAT AACATTGTGG 
GCATACACTA TCAATACAAT ACCTGAGATA GAGTTAATTT TGAGTATTCA CTCAGAAAGA 
AATTTACAGG TAGTTGCTTC TAAGATATCA AGTTCTATGA ATTCTTCGTT CCTTCATGAG 
TAGTCATGGT GATAATACTA TAATATATAC ATTACAAGTA AAAATACAGT GGCAGCAATC 
ATCT

Protein sequence

MLTLAIGDLY IPERALDLPA KFRKLLCPNP QSIPTNSKIS EVICLGNITN SVDTLKFLHD 
LSPSLHLVKG EFDDLPILSQ QLSLVSKKDE NVGIYGVITH DNLRIGFTNG YQVVPKNDPL 
ALLTLARELD VDVLIWGGTH KVEAYTLDGK FFVNPGSGTG AFSFDWPEWY EEEENAKEEE 
IKENEDEAKP EKLQKANVID EHILSEVTEL NAIVPSFCLL DTFGSTCTLY IYTHLNGEVK 
VDKVSYTKE