Gene PICST_38082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_38082
Symbol	ERK1
ID	4850864
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	267039
End bp	268127
Gene Length	1089 bp
Protein Length	362 aa
Translation table
GC content	45%
IMG OID	640392572
Product	Extracellular signal-regulated kinase 1 (ERK1) (MAP kinase 1) (MAPK 1)
Protein accession	XP_001387701
Protein GI	126273769
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATAG AACAACCAGA ACAGGCGCCA GCACGGCAGA TATCGTTCAA TGTATCGAGC 
CATTACCAAA TTTTGGAGAT AGTTGGCGAG GGAGCATATG GAATCGTTTG TTCAGCCATT 
CACAAGCCTC TGAACCAGAA AGTAGCCATC AAGAAAATCG AGCCGTTTGA GAGATCAATG 
CTTTGCCTTA GAACACTAAG AGAACTCAAG CTCCTTAAGC ATTTCAACCA CGAGAACATC 
ATCAGCATTC TTGCTATCCA GAGACCTGTG AGCTACGAGT TTTTCAACGA AATCTATCTT 
ATACAAGAGC TCATGGAAAC AGACTTACAT AGAGTGATCC GCACCCAGAA ACTCACCGAT 
GACCATATCC AGTATTTCAT CTACCAGACA CTTCGTGCCC TTAAGGCTAT GCATCTGGCC 
AATGTGTTAC ATAGAGACCT CAAACCGTCA AACTTGTTGC TCAACTCCAA TTGCGACTTG 
AAAGTATGTG ACTTTGGCCT TGCCCGTTCC ATCGCTAGTA GTGAAGACAA TTTCGGGTAT 
ATGACTGAAT ATGTCGCGAC CAGATGGTAT CGAGCACCAG AAATCATGCT CACTTTCCAG 
GAGTACACCA CGGCTATCGA TGTCTGGTCT GTAGGCTGTA TTCTCGCCGA AATGCTCAGC 
GGTAGGCCTC TTTTCCCGGG CAGGGACTAC CACAATCAGC TTTGGCTCAT AATGGAGGTC 
CTTGGGACAC CTAACATGGA AGACTACTAC AACATCAAGA GCAAGCGAGC ACGAGAGTAT 
ATCCGATCAT TACCGTTCTG CAAAAAGATC CCGTTCCAGG ACCTCTTTGG AAACATCAAC 
CCCAACGTCC AAATCAACCC GTTGGCCATA GACTTGTTGG AGAACTTGCT TATTTTCAAT 
CCTGCCAAAC GTATCACAGT AGACGACGCA TTAAAACATC CTTACTTGAA GCTCTATCAT 
GATCCAAATG ATGAGCCTGT TAGCGAGAAA ATCCCCGAGG ACTTCTTTGA CTTTGACAAG 
AGAAAGGACG AGCTTAGCAT TGATGATTTG AAGAAAATGT TGTACGAAGA AATCATGAAA 
CCTTTATAG

Protein sequence

MNIEQPEQAP ARQISFNVSS HYQILEIVGE GAYGIVCSAI HKPLNQKVAI KKIEPFERSM 
LCLRTLRELK LLKHFNHENI ISILAIQRPV SYEFFNEIYL IQELMETDLH RVIRTQKLTD 
DHIQYFIYQT LRALKAMHLA NVLHRDLKPS NLLLNSNCDL KVCDFGLARS IASSEDNFGY 
MTEYVATRWY RAPEIMLTFQ EYTTAIDVWS VGCILAEMLS GRPLFPGRDY HNQLWLIMEV 
LGTPNMEDYY NIKSKRAREY IRSLPFCKKI PFQDLFGNIN PNVQINPLAI DLLENLLIFN 
PAKRITVDDA LKHPYLKLYH DPNDEPVSEK IPEDFFDFDK RKDELSIDDL KKMLYEEIMK 
PL