Gene PICST_89338 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_89338
Symbol	ERG20
ID	4838897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	1433290
End bp	1434426
Gene Length	1137 bp
Protein Length	350 aa
Translation table	12
GC content	44%
IMG OID	640390212
Product	arnesyl diphosphate synthetase (FPP synthetase)
Protein accession	XP_001384571
Protein GI	126136094
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0142] Geranylgeranyl pyrophosphate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

AAAAAAACAA CACTTCGTCA ACATGAGCAA AGAGGCTTCT AGAGCTAGAT TTATAGGTGT 
GTTCGACCAA TTGGTTGAAG AATTGAAGGA GGTCTTGGTC GGCTACAATA TGCCTCAAGA 
GGCTGTAGAT TGGTTTGTCA AGAACTTAGA CTACAACACC CCAGGAGGAA AGTTGAACAG 
AGGTTTATCC GTAGTTGATA CCTACTGTAT TTTGAACAAG ACCACCGCCG TAGAGTTGGA 
TGACGAAAAA TATGCCAAGG TAGCTCTTTT GGGTTGGGCC ATTGAATTGC TCCAGGCCTA 
CTTCTTGGTA GCTGACGACA TGATGGACCA GTCCAAGACC AGAAGAGGCC AGCCATGTTG 
GTACTTGGCT GAAGGAGTAG GAAACATTGC CATCAACGAT TCCTTCATGT TAGAAGGTGC 
CATCTACGTG TTGTTGAAGA AGCACTTCAG AAACGACTCG TACTATGTAG ACTTGTTGGA 
CTTGTTCCAC GAAGTCACCT TCAAGACGGA ATTGGGCCAG TTATTGGATT TAGTCACTGC 
TGATGAATAT GTGGTTGATT TGGACAAGTT TTCCTTGGAC AAGCACTCAT TTATTGTCAT 
CTTCAAGACT GCCTACTACT CGTTCTACTT ACCTGTAGCC TTGGCAATGT ACATGTCAGG 
CATCAACTCT GCAGAAGACT TGAAGCAAGT GCAAGACATC TTGATCCCAT TGGGCGAGTA 
CTTCCAGATC CAGGACGACT TCTTGGATTG CTTTGGTACC CCAGAACAGA TCGGCAAGAT 
CGGAACTGAT ATCAAGGACA ACAAATGTTC GTGGGTCATC AACCAAGCTC TTTCCCGTGT 
AAACAAGGAA CAGCGTGAGC TCTTGGATAA CAACTACGGA AAGAAGGACG ACGTTTCTGA 
ACAAAAATGT AAGGACTTGT TCAAGGAATT AGGCATTGAA CAGGTCTACC ACGACTACGA 
AGAAGCTGTT GTTGCCAAGT TGAGATCACA AATTGAAAAG GTTGACGAAT CCAGAGGCTT 
GAAGAAGGAA GTTTTGTCTG CCTTCTTGGC CAAGGTGTAC AAGCGTTCGA AGTAGGCTAT 
ACATCTCTGT ATTGGAATGT TGGTATATCT ACATTAATAA ATATTATTAG AGACTTC

Protein sequence

MSKEASRARF IGVFDQLVEE LKEVLVGYNM PQEAVDWFVK NLDYNTPGGK LNRGLSVVDT 
YCILNKTTAV ELDDEKYAKV ALLGWAIELL QAYFLVADDM MDQSKTRRGQ PCWYLAEGVG 
NIAINDSFML EGAIYVLLKK HFRNDSYYVD LLDLFHEVTF KTELGQLLDL VTADEYVVDL 
DKFSLDKHSF IVIFKTAYYS FYLPVALAMY MSGINSAEDL KQVQDILIPL GEYFQIQDDF 
LDCFGTPEQI GKIGTDIKDN KCSWVINQAL SRVNKEQREL LDNNYGKKDD VSEQKCKDLF 
KELGIEQVYH DYEEAVVAKL RSQIEKVDES RGLKKEVLSA FLAKVYKRSK