Gene PICST_39206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_39206
Symbol	PDT1
ID	4851197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	1175297
End bp	1176388
Gene Length	1092 bp
Protein Length	363 aa
Translation table
GC content	45%
IMG OID	640392905
Product	predicted phosphatidyl synthase
Protein accession	XP_001387869
Protein GI	126274183
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0647] Predicted sugar phosphatases of the HAD superfamily
TIGRFAM ID	[TIGR01456] HAD-superfamily class IIA hydrolase, TIGR01456, CECR5 [TIGR01460] Haloacid Dehalogenase Superfamily Class (subfamily) IIA

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.116854
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0363344
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAAAT ATACTACTGG AAACAGCAAT TTGGCATTTG TATTTGACAT TGACGGTGTG 
CTCATCCGGG GAGAAAAGGC AATTCCCGGG GCTGGACCCA CACTTGAGCT TTTGAACGAA 
CACAAGGTTC CATTCATCTT GTTGACAAAT GGCGGCGGAG TTCTGGAGAA GGAAAGAGTG 
CAGTTCATAT CTGAAACCGT GCAAGTTCCC ATTTCTCCTT TGCAGATTGT TCAGAGCCAT 
ACCCCAATGA AGGCATTGGC CCATAAACAT GCTTACGACC GGGTCTTGGT AGTTGGTGGT 
CCCGGAGATA AGGCTAGGCA CTGTGCCATT GGTTATGGAT TCCACGATGT AATAATGCCT 
ATAGACATTG TTAGAGCCAA TCCGGCCGTA TCGCCTCATC ACAGATACAC AGTCGAAGAC 
TTTGACCGTT ACTCCCGGGA AGTCGATTTA AAGAAACCCA TTGAGGCCAT CTTGGTGTTT 
AATGACCCCA GAGACATGAC AACTGATATT CAGATTGTTT CAGATTTGCT CAATTCAGAT 
CACGGAGTTA TAGGAACGAA GCGCTCTATC ACGAAGTTGA AACATCGTGA AGACCCGTCT 
ATCCCCATCA TATTCAGTAA CAATGACTTC CTCTGGGCCA ATGACTATGC GTTGCCACGT 
TTTGGTCAAG GTGCATTTAG AATAATCGTA GAGAACTTGT ATCGTGAAGT TAACCAATTG 
AAAGACAGCC AACATTTGCA CTCTATAATT ATGGGCAAGC CGTTCAAGAT TCAGTACGAC 
TTCGCCCACC ATGTGCTTAT TGACTGGCGC AACAAGCTTT TGGCAAACGA TACAAGCTCA 
CAATCGCAAT TCTTGCCTAA CTTAGGTAGT GAACCCAAGA ATTCGCCGTT TAAGAGCATT 
TTCATGGTGG GTGACAATCC GGCCTCTGAC ATTAAGGGTG CTAACGACAA TGGGTGGGAG 
TCCATTCTCG TCAGAACAGG TGTCTACGAC AATGAGGATT TAAGCACGAT CATCGCCCAG 
CCTACTGTGG GAGTATTTGA CGATGTCTAT GCGTCTGTCG AAGCAGTCTT GAAATCTCAA 
AAGATTCTCT AG

Protein sequence

MRKYTTGNSN LAFVFDIDGV LIRGEKAIPG AGPTLELLNE HKVPFILLTN GGGVLEKERV 
QFISETVQVP ISPLQIVQSH TPMKALAHKH AYDRVLVVGG PGDKARHCAI GYGFHDVIMP 
IDIVRANPAV SPHHRYTVED FDRYSREVDL KKPIEAILVF NDPRDMTTDI QIVSDLLNSD 
HGVIGTKRSI TKLKHREDPS IPIIFSNNDF LWANDYALPR FGQGAFRIIV ENLYREVNQL 
KDSQHLHSII MGKPFKIQYD FAHHVLIDWR NKLLANDTSS QSQFLPNLGS EPKNSPFKSI 
FMVGDNPASD IKGANDNGWE SILVRTGVYD NEDLSTIIAQ PTVGVFDDVY ASVEAVLKSQ 
KIL