Gene PICST_41956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_41956
Symbol
ID	4836776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	2662056
End bp	2663087
Gene Length	1032 bp
Protein Length	343 aa
Translation table	12
GC content	44%
IMG OID	640388091
Product	predicted protein
Protein accession	XP_001383263
Protein GI	150864446
COG category	[I] Lipid transport and metabolism
COG ID	[COG0020] Undecaprenyl pyrophosphate synthase
TIGRFAM ID	[TIGR00055] undecaprenyl diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGATT GGTTATCCAC ATTTCCTGGC TACCGACAGG CGCTAACTAC GGCTAAGCGG 
GCATTTGGGA GATTCATCCA GACAGGGCCC ACGCCGAAAC ACGTAGGAAT CATCATGGAT 
GGTAACAGAA GATATGCCAA AAATCACAAG ATAGAGATCA AAGAGGGGCA CAATCTTGGA 
TTCGACAGCA TGGCCAATGT GCTCGAGATT TTGTATGAAT CTGGTGTCAA GTGTGCTAGT 
GTCTACGCAT TTTCCATTGA AAACTTCCGT AGACTGAGCT TAGAAGTCAA GTGGTTGATG 
GACTTGGCCA AGCTGAAGTT CCAACAGATC AACCAGCATA GCGACTTGTG CGCTGAATAC 
GGCATCCGCA TCAAGATAAT AGGTAATAAG AAGTTGATAC CACCAGACGT TGCTAAAATT 
CTACAACAAA CAGAGGAGAT TACTAAGGAC AACAAGAGAG CATTGTTGAA TATCTGTTTC 
CCATATACCT CTAGAGACGA GATGACAAAT CTGATCAAAT GTGCCGTAGA CCAGTCCACA 
ATAGATCACG ACTTTGTAAT AGATGAGGAC ACTCTCGAAA GCTTATTCTA CACCCATGAT 
GCGCCTCCTT TAGACTTATT GGTGAGAACA TCTGGTACCT TCAGATTATC TGATTTCTTA 
TTGTGGCAGT GCGTTTCGCC AGACTGTTCA ATCGTATTTG TAGATAAATT GTGGCCCGCT 
TTCACTCCCT TCGACATGGC CAAGATTTTG TTCAACTGGG GATTCAACAT GTACTGGTAT 
GGCAAAGGCA ATGGCTACAG CACAACCCAA ATCTCTACCA AGAACTTTAA TCTAGCCGAG 
TACGACTCTA ATGTAGACTT GAATGATGCT ACTGGATCTA GTGGATTTCA ACGTTTCGCC 
AGCTCAGAAA GCGAAGAGGC CGAAGATGAA GATGATGTCG TCACTGAAGA AAGTAGTCAA 
TCTGGTGGAG TCGATGAACT CGACACTGTT ACTTCAGAAG AGGAATCCGA CTCGAACAAA 
AAGGGAAGGT AG

Protein sequence

MSDWLSTFPG YRQALTTAKR AFGRFIQTGP TPKHVGIIMD GNRRYAKNHK IEIKEGHNLG 
FDSMANVLEI LYESGVKCAS VYAFSIENFR RSSLEVKWLM DLAKSKFQQI NQHSDLCAEY 
GIRIKIIGNK KLIPPDVAKI LQQTEEITKD NKRALLNICF PYTSRDEMTN SIKCAVDQST 
IDHDFVIDED TLESLFYTHD APPLDLLVRT SGTFRLSDFL LWQCVSPDCS IVFVDKLWPA 
FTPFDMAKIL FNWGFNMYWY GKGNGYSTTQ ISTKNFNLAE YDSNVDLNDA TGSSGFQRFA 
SSESEEAEDE DDVVTEESSQ SGGVDELDTV TSEEESDSNK KGR