Gene PICST_33690 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33690
Symbol	PHA2
ID	4840877
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	-
Start bp	224035
End bp	225137
Gene Length	1103 bp
Protein Length	306 aa
Translation table	12
GC content	43%
IMG OID	640392192
Product	Prephenate dehydratase (PDT)
Protein accession	XP_001386638
Protein GI	150866894
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.748096
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCACCA AAGTCGCATT CTTGGGTCCA GAAGGGACAT ATACACATCA AGTACGTTTT 
TTTTTAGAGG AAAAGGAGCC AAAACAAGAT CTGACTCATT CTCAGACCAC CGTTCTACTT 
TTCAGACATG ATCTGGTTTA CTAACTCTTC TAAAGGCAGT TATCCAGCAG TTCGGCAACA 
AAGACAATGT TCTGATATAT CCAGTCAAGA CAATTTCAGA CTGTTTCAAA GAGATCCACT 
CCAAAAATGT AGATTTCGCT GTGGTTCCAT TAGAAAACTC TATCAATGGT GGTGTAGTTT 
TCACTTTTGA CCTCATCAGA GATTGGTTCA TACCGTCTTT GCAGAACAAT AGTAGACAAA 
ATGACGACAG TGGCTTCTTA AGTCCACCCC CTTCTTCTAA AACGACGACA TCTTCAACGT 
CTTCCAAGCC AACTTTCAGA ATCGTAGCTG AGCAGTTTGT GTCTATTCAC CATAACTTCT 
TAACTAGGGC AGAAGACGTC TCCAAGATCA CATGTATATA TTCTCATCCC CAGGTGTGGA 
CCCAGGTCAC AGGCTTCTTG TCAACTATCC CGGCTAGCAT TCCCAGAATA GACAGTACGT 
CTACTTCAAA GGCTGCTGAG TTGGTTAATG GTGACGAATC CAATACCTCA GCCTGTATCT 
CATCTCAGAT GAGTTCAGAC TTGTACCAAT TGCCTATAAG AAATGCCAAC ATAGAGGACA 
ATCCTAACAA CACCACCAGA TTCTTAGTTT TGGGATACGA GAAACCACCC GCTCCATCTC 
CATCCCCAGC TCCAGAAGTT GGAGAGCCAG AAAGACCAGA TTCTCGTATT ACTTCTATCA 
TCTTCACTTT GAATCACAAT GATCCAGGTG CACTTTGTGA CGTATTGTAC GAGTTCAAGA 
AGAATGGAGT CAACTTGACT TCGATCACAT CTAGACCATC CCATTTGAAA CAATGGCAGT 
ATGTTTTCTT CGCAGAGGTC ATTGGCGATC TGAGCAGTGA CGCTAATATT GCTAAAGGTA 
TAGAGCTGGC TAGTAGTATT TGTCTGGAAT TGGTAGTGCT CGGTTCCTTT GACAGAAGCT 
GGAGGTACTG GAAATCATCG TAG

Protein sequence

MVTKVAFLGP EGTYTHQAVI QQFGNKDNVS IYPVKTISDC FKEIHSKNVD FAVVPLENSI 
NGGVVFTFDL IRDWFIPSLQ NNSRQNDDTE QFVSIHHNFL TRAEDVSKIT CIYSHPQVWT 
QVTGFLSTIP ASIPRIDSTS TSKAAELVNG DESNTSACIS SQMSSDLYQL PIRNANIEDN 
PNNTTRFLVL GYEKPPAPSP SPAPEVGEPE RPDSRITSII FTLNHNDPGA LCDVLYEFKK 
NGVNLTSITS RPSHLKQWQY VFFAEVIGDS SSDANIAKGI ESASSICSEL VVLGSFDRSW 
RYWKSS