Gene PICST_37142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_37142
Symbol	CYP52
ID	4841090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	+
Start bp	217096
End bp	218370
Gene Length	1275 bp
Protein Length	424 aa
Translation table	12
GC content	44%
IMG OID	640392405
Product	Cytochrome P450 52A3 (CYPLIIA3) (Alkane-inducible P450-ALK1-A) (P450-CM1) (CYP52A3-A) (Cytochrome P-450ALK)
Protein accession	XP_001386440
Protein GI	150866745
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCATGA CAACCGATCC CGAGAACTTC AAGGCTATGT TGGCTACCCA ATTTAATGAT 
TTTTCTATTG GCCGTAGATA CCAGATCTTG AGTCCAGTGA TTGGTGACAG TATCTTCACT 
TTGGATGGTG AAGGTTGGAA GCACTCCAGG GCCATGTTAA GACCCCAGTT TGTCAGGGAG 
CAAGTTGGAC ATGTCCAGGC TTTGGAACCT CACTTACAGT TACTTGCTAA ACATATTCGC 
TCCTACAAAG GAGAAACAGT TGATTTGCAG CAGTTGTTCA CTAAGTTCAC TCTTGATACA 
GCTACAGAAT TCCTTTTCGG TCAAAGTGTT CATACCTTGT ATGACGAAAG AATTGGCATG 
AAGACTCCTG ATGATGTTCC ATATGCGAAA GACTTCACCG ATGGTTTGTT TATTACCCAA 
AAGTACACCT CGGAAAGAGG CTATGCTCAA CAGTTCTACT GGTTAATTGA TGGCAAGGAA 
TTCAGAACTG CGATTGCCAA CGTTCATAAG TTCGCCCGTT TTTACGTCGA TAGGGCTCTC 
AACTTCTCGC AAGCTGAGCT TGAAAAGAAA TCACAGGAAA GTTATACCTT CTTATACGAG 
TTGGTGCAAC AAACCAGAGA CCCTAAAGTT CTCCAGGATC AATTGCTTGC CATCATGTTA 
GCTGGCAGAG ACACCACATC TTCACTACTT TCATTCATCT TCTACGAACT TTCCCGCAAC 
CCTGGGATTT GGGAAAAGTT GAAAAAGGAA GTATACGAAA ACTTTGGCTC TGGAACAGAA 
AAAGATATTG CCAAGATCAC GTTCGAATCG TTGAAGAAGT GTAACTACGT GAAGTGGGTG 
ATTAACGAAA CGTTGAGAAT GTACCCTACT GTGCCTGTTA ATTTGAGGGT CTCTAATAAA 
GATACTCTGT TGCCTAAAGG AGGTGGTGAA GACGGAAAGT CGCCAATTTT TATTCCACGG 
GGCACTACAG TTGGGTTCAG AGTTTACTCC ACGCAGAGAA ATAAAGAATA CTACGGTGAA 
GATCCTGACG TTTTCAGACC GGAAAGATGG GCCGACATCG GCAAGTTGGG ATGGGCATAC 
CTTCCGTTCT TAGGAGGACC CAGAACATGT ATCGGACAAC AGTTTGCCCT CACCGAAGCC 
GGGTACATTC TCGTGAGAAT AGCTCAATTG TTCCCTAACC TCAAGTCTAA GAACAGTGTT 
CATTATCCTC CAAAGAAGAC TCTCAACGTT ATTTTCAATC TCTTTGAGGG CTGTTTGGTG 
GAGATGGGTG AGTAG

Protein sequence

MFMTTDPENF KAMLATQFND FSIGRRYQIL SPVIGDSIFT LDGEGWKHSR AMLRPQFVRE 
QVGHVQALEP HLQLLAKHIR SYKGETVDLQ QLFTKFTLDT ATEFLFGQSV HTLYDERIGM 
KTPDDVPYAK DFTDGLFITQ KYTSERGYAQ QFYWLIDGKE FRTAIANVHK FARFYVDRAL 
NFSQAELEKK SQESYTFLYE LVQQTRDPKV LQDQLLAIML AGRDTTSSLL SFIFYELSRN 
PGIWEKLKKE VYENFGSGTE KDIAKITFES LKKCNYVKWV INETLRMYPT VPVNLRVSNK 
DTSLPKGGGE DGKSPIFIPR GTTVGFRVYS TQRNKEYYGE DPDVFRPERW ADIGKLGWAY 
LPFLGGPRTC IGQQFALTEA GYILVRIAQL FPNLKSKNSV HYPPKKTLNV IFNLFEGCLV 
EMGE