Gene PICST_38202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_38202
Symbol	SEH1
ID	4850798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	82511
End bp	83476
Gene Length	966 bp
Protein Length	321 aa
Translation table
GC content	44%
IMG OID	640392506
Product	epoxide hydrolase, soluble (sEH)
Protein accession	XP_001387255
Protein GI	126273542
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.927116
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.566303
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGAAA GATTCGTTAT CAAACTTACC CACGGTTCCA GAAGTTTCAC CACCTTCTCG 
AACTACAGCG AACAAGATGT TTTCAAAGGT GCCGGAACCA AATGGACAAG AGTGATCTTT 
CTCTTGCATG GGTTTCCTGA TGAAAATTCG TCCTATGATG AAGCCTGGCC GCATTTAGCA 
CAAGGGTTTC CTAATGAAAA GGGTCTTTTG TTGCTAGCAC CATTATTGAG AGGCTACGAA 
GAGCTGAGTT TGGGGCCAGA CGAATATAGT ACTCATGATG TCGCTGGAGA CGTCGGTGCC 
TGGATCAAGC AGATTAACCC CAGCAACAAG GTTCCAGTTC ACATTTTGGG CCACGATTGG 
GGTGCTATAA CTGCCTTCAA AACTGCTTCA AGGTTTCCAG AGTTGGTTAC TTCAATTGTG 
ACTTTGGCAA TTCCTTATTT GACCAATGTG GTTCCCTGGA AGTTGGCTTG GAATGTTCCT 
GAACAGTTGT ACTATTCGTC GTATATGGTG ACGATGCAGT TATCGTTCTT GTACAGATCC 
AGATTCGAAC AAACAGGCAG AGATTCGTAC TTAGATTCGC TCTGGAAGTA CTGGTCTCCT 
ACCTGGAAGT ATACCGAAAA AGATATTAGT AAGACCAGAG CCAGATTGAG TGATCACAGA 
ATCATGGATG CTACCACAGC CTATTACAGA GCCATCTTCA ACCCGATTAA CCTTATTAAC 
GGCAAGTCTA AATGGCCCGT TGACTTCAGC CAAGTTCCCA CATATTTTAT AGGTGGAGCC 
CAAGACGGTT GTATGACCAG CAAGTTGTAT GAATGGGAAA GAGAGTTGTT GAAGGACGAA 
CCCAATGTCA AGACCACTAT TTTGCCCAAC CTGGGCCATT TCTTACATCG AGAAGAACCC 
CAAAAAGTTG CTGAGTTAGC GATTGAGTTC TTCGAAAAGT ACTCTTCCAA GGCTACCAGT 
AGTTAG

Protein sequence

MTERFVIKLT HGSRSFTTFS NYSEQDVFKG AGTKWTRVIF LLHGFPDENS SYDEAWPHLA 
QGFPNEKGLL LLAPLLRGYE ELSLGPDEYS THDVAGDVGA WIKQINPSNK VPVHILGHDW 
GAITAFKTAS RFPELVTSIV TLAIPYLTNV VPWKLAWNVP EQLYYSSYMV TMQLSFLYRS 
RFEQTGRDSY LDSLWKYWSP TWKYTEKDIS KTRARLSDHR IMDATTAYYR AIFNPINLIN 
GKSKWPVDFS QVPTYFIGGA QDGCMTSKLY EWERELLKDE PNVKTTILPN LGHFLHREEP 
QKVAELAIEF FEKYSSKATS S