Gene PICST_59919 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_59919
Symbol	EKI1
ID	4839264
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	+
Start bp	1613777
End bp	1615408
Gene Length	1632 bp
Protein Length	526 aa
Translation table	12
GC content	44%
IMG OID	640390579
Product	ethanolamine kinase
Protein accession	XP_001385006
Protein GI	150865683
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.671475
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.729563
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTCCT CAGACCTCCA GCAGTCTTCC TCGGCCTACT GCTTCATAGC GAACAAAGAC 
GTCCACTGCA TCCCCATCAA CTCGTTCAAC AGCTACTCCG ACTCTTTCCT AGCCTTGGAC 
AATACCAAAC ACCAAAGGGA CGATGCAGAC TTCACACCCG ACAAACTCTA CTTGAAGAAC 
AGAAACTTGC TCTACAGCCT CAACAACCCT TCACTTTCAG ATGTCGAATT CGAACCAAAC 
TCTCCAACTC CACTCCACTC CACACTTAAC ACTGCCAATA ACAATACCCC TATCAATGGT 
AACCATAATG GTAACAATAG CCATTCGAAT TCCACTAGCT TGTCCGTGCC GTCGACTTCT 
TCTTCTTTCC GTAAATCCAT CAGTACCACC CCCAGTCCTC CGGCTTCCGA CGTTGACCTC 
TCGGCTATCA TCAATAATTA CGCGACTCAC GCCGTATACT TTCCCAAACT CATAGTCAAC 
TTGTCCGAGA ATTTGAACAA CAACTTCCAG GACTTGAAGA CCTTATTGGT GAAAATCTTT 
CCCACTTGGA GTAACAAAGA TGAGATCACT TTGAAACAGC TTACTGGTGG TATCACCAAC 
ATGTTGCTTA GATGTTCCTA CAAGCCGTTG CAGGAAACTG TACTCATCAG AGTATATGGC 
CACGGAACCA ACTTAATTAT CGACAGACAC CGTGAGTTCA TTCTGCACTT GATTCTCAAC 
TCCATCGGCT TGGCTCCTCC CATCCATTCC AGATTCAAGA ACGGATTGAT CTACGGCTAT 
CTCTCTGGCC GGTCATTGGA ATCGTCCGAA TTGTATAGCC CCAACTTGTA TCCCTTAATC 
GCACAACAGC TCGGAAATTG GCACAACCAG TTAGACTACC GCTTGATCCA GAACGGTGTG 
GAAAAGATCA GAACCTTTTC CATGAGCTTG AAGTCGAAAA CAAAAAGAGA CAGCATAAGT 
AATGGTTCTA CAAAGAAGAG ATATAAGAAG AAATTCATCT CCAACATATG GGAATTAATA 
GAAGACTGGA TCAATATTGT GCCTGTGAAC CCGGACTTGA TATCGTCGTT TAACTCCAAT 
TTGAGCCATG AAGTCACCGC TGAAAACCTC AAGAGTATCA TTACCGAGGA GTTTGAATGG 
TTGAAGGAAA ACTTGATCAA TTCAAATTCA CCTGTAGTAT CTTCACACTG CGATTTATTA 
TCTGGAAATG TGATCATCCC AGACGACCTC GATATCAAGA AACCTTTACA TTCCTTACCA 
ACTATTGAAA AGAACCCTAT CAAATTCATA GACTACGAGT ATATGTTACC AGCACCTCGT 
GCTTTCGATA TTGCCAACCA TTTGGCAGAA TGGCAGGGAT TTGATTGTGA CAGATCCGTC 
ATCCCCACAC CTCACATAAG CAACCCTGTT TTAGTGAAAT GGGTGAAAGG ATATCTTAAC 
GACGAAAACG CGGATATGGA TAAAGTCGGC AGCTTGATAG AAGAAATCGC TACCTTCTAT 
GGTTTGCCAG GTTTCTACTG GGGTATCTGG GCCATGATCC AAAGCGAGTT GTCAAATATC 
GACTTTGATT ACTCTAAGTA CGGAAAGTTG AGACTAGAAG AGTATTGGGT CTGGAAAGGA 
CATTTCTTGA AA

Protein sequence

MDSSDLQQSS SAYCFIANKD VHCIPINSFN SYSDSFLALD NTKHQRDDAD FTPDKLYLKN 
RNLLYSLNNP SLSDVEFEPN SPTPLHSTLN TANNNTPING NHNGNNSHSN STSFPPASDV 
DLSAIINNYA THAVYFPKLI VNLSENLNNN FQDLKTLLVK IFPTWSNKDE ITLKQLTGGI 
TNMLLRCSYK PLQETVLIRV YGHGTNLIID RHREFISHLI LNSIGLAPPI HSRFKNGLIY 
GYLSGRSLES SELYSPNLYP LIAQQLGNWH NQLDYRLIQN GVEKIRTFSM SLKSKTKRDS 
ISNGSTKKRY KKKFISNIWE LIEDWINIVP VNPDLISSFN SNLSHEVTAE NLKSIITEEF 
EWLKENLINS NSPVVSSHCD LLSGNVIIPD DLDIKKPLHS LPTIEKNPIK FIDYEYMLPA 
PRAFDIANHL AEWQGFDCDR SVIPTPHISN PVLVKWVKGY LNDENADMDK VGSLIEEIAT 
FYGLPGFYWG IWAMIQSELS NIDFDYSKYG KLRLEEYWVW KGHFLK