Gene PICST_35590 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_35590
Symbol	ALK2
ID	4838296
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	+
Start bp	1154778
End bp	1156349
Gene Length	1572 bp
Protein Length	523 aa
Translation table	12
GC content	45%
IMG OID	640389611
Product	n-alkane inducible cytochrome P- 450
Protein accession	XP_001383506
Protein GI	150864612
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAATT TTATTGAATT CGTCACCACC AACTGGTACA TCATCATTCC AGCACTTCTA 
GTGTTGCACA AGGTCTTTGA CCTCTTGTAT GTTCAGTATT TGTACAGAAA GCTTGGAGCA 
AAGCCTTGCA CCAACCAGAC AGATGACCAT GCTTTTGGTA TTCGTGCTGG ATTTGAAATG 
TTGAAGAAAA AGAACGAAGG AACTGTTGTA GACTTTGGTG CAGAAAGATT TGAATCCCGC 
ATCGACCCCA AGATCCCAAC CTTTTCCATG AGATTGTTCT TGATTCCAAT TGTGCTTACC 
AGAGACCCCG AAAACATAAA GGCATTATTG GCCACTCAAT TCAACGAGTT CGTATTAGGC 
TCTAGATTCG AACAGCTTGC CCCATTGTTG GGTAAAGGTA TTTTCACGTT GGACGGTGAA 
GGCTGGAAGC ATTCCAGAGC CATGTTGAGA CCACAGTTCG CTAAGGAGCA AGTTGCCCAT 
GTGCAATCTT TGGAACCTCA CATACAAGCC TTGGCCAAGC ATGTTCGTAA CGCCAAGGGC 
AAACTGTTTG ACATCCAAGA ATTGTTCCAC AGATTGACTG TCGACTCTGC CACTGAATTC 
TTGTTTGGTC AATCTGTTGA ATCATTGAGA GACGAATCTG TTGGTATGGC CGATGAAGCT 
ACGGACTTCG CAGGGAAGAG TACCTTCGCC GCTTCGTTCA CCATTGCCCA AAACTGGTTG 
GCTAACAGAG CCGTTGCCCA GAAGTTCTAT TTCCTTATCA ACCCCAAAGA AATGCGTGAT 
TCTATCAAAG ATGTTCACAG ATTTGTCGAT TACTACGTTC AGGTCGCATT GGACACTCCT 
CAAGACGAAT TGGACAAAAA GTCCAAGGAC GGTTACATCT TCTTGTACGA ATTGGTGAAA 
CAGACTAGAG ATCCATACGT GTTAAGATCG CAGTTGTTGA ACGTCTTGTT GGCTGGCCGT 
GACACCACCG CCGGTTTGTT GTCATTTGCT TTCTTCGAAT TAGCCAGAAG ACCAGATATA 
TGGAGCAAGT TGAAGGACGA AATCTATGAG AATTTCGGCC TGGGTGAGAA CTCCAAAGTT 
GACGAGATTA CTTTCGAATC GTTGAAGAGA TGTGAATACT TGAAGGCATT CCTTAACGAA 
ACCTTGAGAT TGTACCCATC TGTCCCTGTT AACTTCAGAG TTGCTACTAA GGACACCACC 
TTGCCAAGAG GTGGTGGTAA GGATGGTAGT GAGCCTATTC TTGTCAGAAA GGGCCAGTCT 
GTCTTCTACA GTGTCTATGC CACTCACAGA AGCGAAGCAT ACTACGGCAA GGACAGACAT 
GTGTTCAGAC CTGAAAGATG GTTCGAGCCT TCTGCTAGGA AGCTCGGCTG GGCTTACTTG 
CCATTCAATG GTGGTCCAAG AATCTGTTTG GGTCAACAGT TCGCCTTGAC TGAGGCTTCG 
TACGTTGTCG CCAGATTGAT TCAACTTTTC CCTAACATTG AAAACTATGA ACCGGAGGAA 
GTTTACCCAC CATTTAAGAA CTCCCAATTG ACCATGAACC TTTTGAACGG GTTACACATT 
GGCTTATACT AG

Protein sequence

MANFIEFVTT NWYIIIPALL VLHKVFDLLY VQYLYRKLGA KPCTNQTDDH AFGIRAGFEM 
LKKKNEGTVV DFGAERFESR IDPKIPTFSM RLFLIPIVLT RDPENIKALL ATQFNEFVLG 
SRFEQLAPLL GKGIFTLDGE GWKHSRAMLR PQFAKEQVAH VQSLEPHIQA LAKHVRNAKG 
KSFDIQELFH RLTVDSATEF LFGQSVESLR DESVGMADEA TDFAGKSTFA ASFTIAQNWL 
ANRAVAQKFY FLINPKEMRD SIKDVHRFVD YYVQVALDTP QDELDKKSKD GYIFLYELVK 
QTRDPYVLRS QLLNVLLAGR DTTAGLLSFA FFELARRPDI WSKLKDEIYE NFGSGENSKV 
DEITFESLKR CEYLKAFLNE TLRLYPSVPV NFRVATKDTT LPRGGGKDGS EPILVRKGQS 
VFYSVYATHR SEAYYGKDRH VFRPERWFEP SARKLGWAYL PFNGGPRICL GQQFALTEAS 
YVVARLIQLF PNIENYEPEE VYPPFKNSQL TMNLLNGLHI GLY