Gene PICST_54239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_54239
Symbol	SPH1
ID	4837053
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	1765295
End bp	1766881
Gene Length	1587 bp
Protein Length	521 aa
Translation table	12
GC content	43%
IMG OID	640388368
Product	Sphingosine kinase, involved in sphingolipid metabolism Lipid transport and metabolism
Protein accession	XP_001383107
Protein GI	150864335
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG1597] Sphingosine kinase and enzymes related to eukaryotic diacylglycerol kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0415674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTCC ATAATAATCT CAGCACAGAA AGGCTCATAT ACCACCAGCA GGACTCCATA 
CGCGCGACGC TTCAAGACTT CGGGATCCAG ATTGATTCCC AGGAATTGCT AGCAATTGAG 
GATGACTCTG TGGACAGTAC ATATTCATTT TGCAGCTGGA AATCTGCACC CGGTCCGGCT 
TACGAGTTGG AAGATAACCG TTCAAGAATT CCATACAGAA ACATCCTCTG GGTACAGCCT 
GTCATTGATG AAACGGGCCA GGTCCAAGAA GACGACTTGG AAATCACATA CGTCAAACCA 
AAGGGCAAGT TGTCGCTCGA GCCAGTCACC TTGCGTATTC TGATCCAAAA CTACCGTGCT 
CTCTATAACA ATCTCCAGGA ATTATCTAAT TCAATACTAG CTAAATCCTA CAAGAACCAT 
ATCGTGAAAC CGTCAGTCTT GGTGATTATA AATCCTCACG GTGGTCAAGG AAAGGCTTTG 
AAGATCTACA ATACGGAAAT AAAGCCAATT TTAAAGGCGG CCAGAGCCAA GATTACTATT 
CAGGAAACAA GTTACCACAA GCATGGAATC GATATCGGGC GTGAACTAGA TATCTCCAAG 
TACGATGTAA TAGCATGTTG TTCAGGAGAT GGAATCCCGC ATGAAATCAT TAACGGTTTT 
TACGAAAGGC CAGATAAGGG CGTGTCTGCT TTCAACAAAA TAGCCATCAC CCAACTTCCG 
TGTGGCTCTG GTAATGCCCT TTCTCTCAGT ACCCATGGAA GTAATGATGC TTCCATGGCT 
ACTTTTCATA TGTTAAAGGC AAAGAGAACT AAGCTTGACC TCATGGCTGT GACTCAAGGT 
GTAGGTCCTA ACGAGAAAAT CAAGTTATCC TTCTTGACGC AATGTTATGG TGTTATTGCG 
GATGCTGATA TTGGCACGGA ACATTTGAGG TGGATGGGGG CGATCAGATT TGATGTTGGG 
GTTTTACACG GTATTTTGGC AAGAAGAAAG TTTCCCTGTG AATTGTATGT CGATTTCTTG 
ACCAATTCAA AACAAGAACT CTCTGCCCAT TTCGACACTT ATCACCAGAA TTCAAATTCG 
ACAGCAGCTC GCATAGAACA TCATTCACAA GATGATGGTG AATTGCCACT ATTGAATGAA 
GAGCGGTTGC AAGTCAAGGG ACCAAAATTG AACCATCCAC CACCTGAATC ATGGACTAAA 
ATAAGCCAAA ACATATCGGA CAATGTCAAC ATTCTCTACG TAGGTAAGAT GCCATATATT 
TCCAACGATG TCCAGTTTTT TCCAGCAGCT CTACCAAATG ACGGATCTAT GGACATGATC 
CTCACAGATA CTAAAACCTC TGTAATGGAA ACCGCTTCCA TTCTCATGTC CTTAGACAAG 
GGATTGCATG TTCATAACGA AAAAGTACAT CATGCTAAGA TTTCGTCTTA CAGATTGATT 
CCAAAGATAC CGCGGAATGA GCAGCATTAT ATTTCAGTGG ATGGAGAAAG TTTTCCATTC 
GAACCGTTAC AGGTCGAAGT TCTACCAGGA GTACTCACGG GCTTGCTACA AGGTGGAAAT 
TTTGTTGATA CGTGCTTTTC ACGTTAG

Protein sequence

MTLHNNLSTE RLIYHQQDSI RATLQDFGIQ IDSQELLAIE DDSVDSTYSF CSWKSAPDNR 
SRIPYRNILW VQPVIDETGQ VQEDDLEITY VKPKGKLSLE PVTLRISIQN YRALYNNLQE 
LSNSILAKSY KNHIVKPSVL VIINPHGGQG KALKIYNTEI KPILKAARAK ITIQETSYHK 
HGIDIGRELD ISKYDVIACC SGDGIPHEII NGFYERPDKG VSAFNKIAIT QLPCGSGNAL 
SLSTHGSNDA SMATFHMLKA KRTKLDLMAV TQGVGPNEKI KLSFLTQCYG VIADADIGTE 
HLRWMGAIRF DVGVLHGILA RRKFPCELYV DFLTNSKQEL SAHFDTYHQN SNSTAARIEH 
HSQDDGELPL LNEERLQVKG PKLNHPPPES WTKISQNISD NVNILYVGKM PYISNDVQFF 
PAALPNDGSM DMILTDTKTS VMETASILMS LDKGLHVHNE KVHHAKISSY RLIPKIPRNE 
QHYISVDGES FPFEPLQVEV LPGVLTGLLQ GGNFVDTCFS R