Gene PICST_33291 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33291
Symbol
ID	4840462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009047
Strand	+
Start bp	228544
End bp	229632
Gene Length	1089 bp
Protein Length	362 aa
Translation table	12
GC content	39%
IMG OID	640391777
Product	predicted protein
Protein accession	XP_001386061
Protein GI	150866452
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACTCTC CTATACTTCG GTATGATTCC GAATCTACTT TAGAAAGTCC CTTCCATCCT 
CCGCGCAACC AATCAAAGAG ACACCACTAC AGTGAAGAAT CAGACAACGA TATGTCCCCC 
TTGAAAAGAA GACAGATTCT ACATGAACCT TCTGAGCTTG CGAACGAACG AAAATTCGAA 
ACGAAGTACA ACTTTAATGA TTGGATCACT AGACATCCAA TAGAAGCTTC AACACCCATG 
AGACCTACGA AGGGAAAGTT TCCAACGGAC TTGTACAAAG AAGAATCCAC TCCATTTTCT 
TATAGGGAAG AAGCTTCAAC TTCTGAAAAA AGTCTAGGTC TATCTCTATC CGGAAAACTC 
TACAGGGACT TCAAAACGCC TCCTACTACT GCCTTCGACA TTTTTGAAAG GACCCAAGTT 
ACAGAAGAGA GCATTATCTC GCCTGAACTT GAAGCAGTTA GAAGAAGCTT CTTTGCGGAT 
TGTTCACTCG GAATTGAAAA TGATCATATA ACCCAACAAT CGAAGGAAGA AAAAACTGGA 
CAATCAAATA CTGAAGGCTA TGTAATGGAT CTTATAGGGT CTTCGCTTCT TCCTCAAAAT 
CTAAGACCTT ATCGATACTA TATCAATAAA GATGTGTCAC CCATTTACAA GACAACACGA 
AGACTAGAAG CTGAAGATAA GAAAAATAGC TTAATCGATT CAGAAGCAGA GCTAGTGCCA 
ATAACCACTT CTTTCTTTTT AGAGAAAGAA CCTGGGACTT TTCCTATTCA ACCAATTTTC 
CCAAATTGGT TGGTCTCAAA ATTGGCAACT ACCGAAAAAT CAAACTTCAA AAACACAATT 
CCTTCCACTA AGACTGAAAG AGAGTACTTT CCAGAAGGTG AAGACAATCA GACTGTGCTC 
TCTTGTTCGG ATATCCCAAT TCTGAGTGGT ACTAAAAGAG CATGCAAGCG TTCAACTTCT 
CAAAGGTTTT TTGATTGGAT TGAAAAGTTG AAGAGAGAAC ACGAAGAAAG GAGACTCAAA 
CGTAAAGCCG TAGGCAAAGG TGTGATTCAA CTTACACGTC AACCACAGTA TTCTTATAAA 
GACAAATAG

Protein sequence

MYSPILRYDS ESTLESPFHP PRNQSKRHHY SEESDNDMSP LKRRQILHEP SELANERKFE 
TKYNFNDWIT RHPIEASTPM RPTKGKFPTD LYKEESTPFS YREEASTSEK SLGLSLSGKL 
YRDFKTPPTT AFDIFERTQV TEESIISPEL EAVRRSFFAD CSLGIENDHI TQQSKEEKTG 
QSNTEGYVMD LIGSSLLPQN LRPYRYYINK DVSPIYKTTR RLEAEDKKNS LIDSEAELVP 
ITTSFFLEKE PGTFPIQPIF PNWLVSKLAT TEKSNFKNTI PSTKTEREYF PEGEDNQTVL 
SCSDIPISSG TKRACKRSTS QRFFDWIEKL KREHEERRLK RKAVGKGVIQ LTRQPQYSYK 
DK