Gene PICST_33854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33854
Symbol
ID	4841161
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	+
Start bp	626487
End bp	627827
Gene Length	1341 bp
Protein Length	435 aa
Translation table	12
GC content	40%
IMG OID	640392476
Product	predicted protein
Protein accession	XP_001386521
Protein GI	150866802
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.893021
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.424834
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCTGGC CCAAGCATAC ATTTCCAAAG TCGGTTGCTG CTATCCTTAG GAAAGGGCTT 
TGGGCGGAAA GTGAAAAGGG CGAAAATGAC TACCAATTAG CTCTAAAGTA CTATTTAGAA 
GCTCTTGAGC ATTGTAATGA AATTGGCATG GATACTCTTT CTGATGAATA CACGGGAATC 
CAATTGAAAG TAGGAGAAAT GTTTGAACGT CTCAACATGC CCCAGGACGC AGCATTTGTA 
TATAACGAGA TTGCCACGTT ATATTTGATG GTTTTGACAG CAACACCAGA GTCAGAACAA 
GGTAGAAGAA TCAACGACAG AGAGCATAGA CGTCATCTCA TCCAGAAAGA TTTGAGAATC 
GCAACCAAGT TGGTAGAGTT GAACCGAGAC AATCCACAAT TGTGTCGAGC AATCTTGATT 
ACCCACTTGA TTATTGCTCA GGACGAAGTT AGAAAACAGT CTCCATCGTC TGCTAGCCAA 
TTGGCTAAGT TAACCCTGCC TGATGAGGTG CACACAACAG ACAACTATAA GGCTACTGTA 
CATGACGACT CAATAGTAAT TAGGAATGGA GATGTAGTCA CTAGTTTCAA AAAGAGTCCT 
GAACTATGGG AGCCTTTTGC AGAGGAGTAC TTCAATGCCA TGGACTTGTT GGGTGCTTTC 
TGTATTTCAC TTGGAGACTT ATCCATGGCT TCTAAAGTGA AGATATCCAT GACTGAGTCC 
ATGTTATTGG CAGATGTTGA ACCACACAAG ATTCTTCTTT CCCAGTGTAA TCTAGGATCC 
TTGCTTTACT TGCAGGCTGA AGAGTTTCAA GCGCAAGAAA TTGCATGGAG AAGAAAATTC 
TCCCAACAAT CGGGTATTGA ATACGAGAAG ATCAAGAGTG AAGAGTTGTT AAATAATCTT 
TCCAACTCAG AACAGGTTCA GAAGGAGTTG GAAAAAGCTA TCCCTGCTGC TGATAAAATA 
AAATATGAAG AATCCATTGC TTCAAAAGAT AAATGTCTCC AATTATCAAT CAAATCCTAC 
GAATCAGTAC TTGAGTTTGC CAAAGGTTTA CCTCAGGAAA TCGTCAAGGG CAATACCGCA 
GTCGGTGAAG GAGTAGCATT AGCCACTTAT GGGTTAGGTG TTGTATATCT TCATCTTTCG 
CAATATGATA AAGCTGAGAG ATTGTTGAGA GAGTCGAGAG TTAGGTCGAA GAACTGTGGC 
TACGATGAAT TGATCACTCA AATTGAACGT GAATTGAATA AGTTATTCAA AGAAAAGAAG 
AATTTGAAGA TTGCAGATCC TAAGAATCCA GCCCCTACTG ATGAAGACAT TGAGATAGAT 
ATCCTCTTGA AGAAAACATA A

Protein sequence

MFWPKHTFPK SVAAILRKGL WAESEKGEND YQLALKYYLE ALEHCNEIGM DTLSDEYTGI 
QLKVGEMFER LNMPQDAAFV YNEIATLYLM VLTATPESEQ GRRINDREHR RHLIQKDLRI 
ATKLVELNRD NPQLCRAILI THLIIAQDEV RKQSPSSASQ LAKLTSPDEV HTTDNYKATV 
HDDSIVIRNG DVVTSFKKSP ELWEPFAEEY FNAMDLLGAF CISLGDLSMA SKVKISMTES 
MLLADVEPHK ILLSQCNLGS LLYLQAEEFQ AQEIAWRRKF SQQSGIEYEK IKKQVQKELE 
KAIPAADKIK YEESIASKDK CLQLSIKSYE SVLEFAKGLP QEIVKGNTAV GEGVALATYG 
LGVVYLHLSQ YDKAERLLRE SRVRSKNCGY DELITQIERE LNKLFKEKKN LKIADPKNPA 
PTDEDIEIDI LLKKT