Gene PICST_33482 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33482
Symbol
ID	4840792
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009047
Strand	-
Start bp	748776
End bp	750005
Gene Length	1230 bp
Protein Length	409 aa
Translation table	12
GC content	39%
IMG OID	640392107
Product	predicted protein
Protein accession	XP_001386340
Protein GI	150866672
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGAAA GCAAACGAAA ATATGGCAGT CTCAAGCGAA ATAGTAGTCC TAACCAAGGT 
AGCAGGATTT CTCCACCTGA AAACGAGTCT CCCACTAGAA TAGCCACACA TTCACAACAA 
TTGTTTGAAT CTAGACCAGA CCATATCAAT GTAAAAACCT ACAAAAGGCG AAACACAGCC 
AAGAAACCAT ATATTCATAT TTCTAAAAAG TCTGACCCGA TTCTTCGAAC ACGAGACAGT 
TCCAGTTTTT TGGATTTAGA AGGTGAAACG AATTCTAGCA TTTACTCAAA ATACGATAAT 
GAATTGAGGT CAGATCTGGA CATAGACGAC TTTGATGCTG GACTCATAGA TTTGGAAGAC 
ATTGGAAAAA CTCAAAACAT ACAAAAATCT CATGATTATT CTGACGAAGT AGAAGGACTT 
ATACAAGTTG TGGAAGATGA GAATACAGAC AGAGTCCCAT CTGTCTCTGA TTCGTTTGCT 
TTGAAAATAG CCAATGGAAA CGTGTTGCAA GTCATGAAAG AGCATCAGGA GTCAAAGACA 
GATGCTGTTA TAGACAAATT CAAGAAGTAC GCATTTCCGT CGCCTATAAG GTCGCGAAAA 
GAGTTGATGA GGAGAGCAGA TAAATATTTT GATGTGCTAC CTTTGATCCT AAAAGGTAAA 
CAAGCACCGT CAGCATATTA TTTATTGGCT AAGAATCAGG CAAACAGTTC TGTTCATGAA 
ACACTTTCAG CTACAGAAAA ATGGCAGATA AATTGGGACA AGTTCTGTGG AGGCTATTAT 
GGCTTCAAGA GACAGCTGTT GATAGGAAAC AGTATTAGTG TAAAATTGGC CAAGGAACTA 
AGAGCGGCGC ATAGAAACAA AACCGTTTCC TATTGGACGA CGTCAGGCTT TGCAACACAT 
GTTCTAGCAA ACGAAGTCAT CATAAGAATG GCTATGGAAG ACTTGCTGTG CGATTTTGAC 
AGTGCTGAGA GGATAGTGAT GGAAAGTGTT GAGTATGGCA AAGTTATCGC AGATGCTACT 
GAAATAGAAG ACGATCTACA GGCAGACGAA TTGGTGCTGA AACAGTCGAA AAAGTTTATG 
AAACAAATTG ATATTGTATC TAAGGTAAAC GAACATATGG AAGAGAAAGA ACAGGAGGAG 
GAAATACCCA GTGCCAAAAG TCAAGGCACA CGAGACTTCC TTGATCAATT GGTAGATAGC 
GATTCTGACT CTGATCCTGA ATCTGAGTAA

Protein sequence

MFESKRKYGS LKRNSSPNQG SRISPPENES PTRIATHSQQ LFESRPDHIN VKTYKRRNTA 
KKPYIHISKK SDPILRTRDS SSFLDLEGET NSSIYSKYDN ELRSDSDIDD FDAGLIDLED 
IGKTQNIQKS HDYSDEVEGL IQVVEDENTD RVPSVSDSFA LKIANGNVLQ VMKEHQESKT 
DAVIDKFKKY AFPSPIRSRK ELMRRADKYF DVLPLILKGK QAPSAYYLLA KNQANSSVHE 
TLSATEKWQI NWDKFCGGYY GFKRQSLIGN SISVKLAKEL RAAHRNKTVS YWTTSGFATH 
VLANEVIIRM AMEDLSCDFD SAERIVMESV EYGKVIADAT EIEDDLQADE LVSKQSKKFM 
KQIDIVSKVN EHMEEKEQEE EIPSAKSQGT RDFLDQLVDS DSDSDPESE