Gene PICST_50481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_50481
Symbol
ID	4840822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	-
Start bp	572975
End bp	574390
Gene Length	1416 bp
Protein Length	471 aa
Translation table	12
GC content	45%
IMG OID	640392137
Product	predicted protein
Protein accession	XP_001386705
Protein GI	150866939
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0522] Ribosomal protein S4 and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.830079
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.176883
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAAGAA AGACCCAGAA CTTGCACTCG TTGAGTAGGG GCCGTGTCCG TGCCTCTATG 
AACAAGTACA ATTTGTTCAA CTTATATAAA AAGGCTCCAG TGAGATATGA TGGAAAGACT 
TTGTACCAAC AGAAGTGGAA CGCTAAAGCT GAAACCAGAG CTTATCACGG TGAACATTTG 
ACTGAAAAGC GTTGGAAGGC CATCTTTGAT CCTTCATTAG AAACCGTAGC TCAATTGGAT 
GCTTCATTGA AGGGTTCTAA AGTAGCACCT ACACCTATGA CTCTCCAGAC CTATGCCTCT 
TTAGAGAAGA GATTGGAGTT GGCTGTCTTC AGATCGATGT TTGCTTCCTC TGTGAGACAA 
GCTCGTGAGT TCATTCTTGG TGGAAGTGTT CTGGTCAACG GTGTTGTGAT AAAGCACCCT 
TCATTCCCCT TGAAGAGTGG AGACATTTTC CATGTCAAGC CAGAGAAGGT CTTGTTAGCT 
ATGGGCAGAA CCAAACCTTC GCTTGAAAAA GCCATTAAGG TCGACAATCA ACAGATCAGC 
GCCTGGAACC GCTATGTGAA AGCAGCACAA GAAAATCCCC GCGAAGTATG GGAAGCCAAA 
CAGAAGAAAC CAGCATCTTT AAATACCATC AGAAACATCA ACGGTTCCGA ATCGGCCGAG 
GAATTCAACA AGAAAATCGA ACAAACTATG AAATCGCAAC AGAATGATGC TACGCGTGAG 
TCTATTTTAT TGAAGATTAT CAGTTTGGGA AGAGGAATCG AAAGCAACGG CGGAGTCGTT 
TCTGCAGAAA CGTTTAAGGA ATTCAACTAC GACAACGAAA GCAACAGCAA CAATGCCCAG 
AAGGCTCATA ACGTGTACAA AAAGTTGTCT GATGCTAAAC ACAAATTGAT TGGCGAACAC 
AATATCGAAA ATGCAGCTGA GTTTGTCAAT AAGAAAGCAG ATGATTCTGA ATCTGCCGCG 
GACAAACAGT TAGCTCGTTC CGTCAAGCAG ATTCTCCGTG AGCTCCAGAA GTCTACCTGG 
GAAGCCATAC GTGTTGGAGC CCAGCAGCAA CAATCTGGCA AGGTGCTCAC TGCCTCATTC 
ACGTCTGATT TCGTTAAGCT GTTGGTGCCA CATCCAGCCT TGAACAAGGA ATCTATTCTT 
GAAGACGAGA CTCTAGCCAA CATCAAGTTC CCATGGCAAA AATCGTTATT TGGCCGTCAA 
GATCCTTCCA AGCCATACTT CACTCCATGG ACACCACGTC CTTTTATCGG TGCCTTTGCC 
ATCTTGCCGT CGCACATCGA GGTATCATTC AGCACATGTC ATGCTGTTTA CTTAAGAGAC 
CCTATCGCCA GACCAGGTCA TTCTGAGGTC ATTTCTCCTT TCCCCGACCA CACCCACGAA 
AGAGCCTATA TGTTCTACGC CAGAAAGGGA TTGTAG

Protein sequence

MPRKTQNLHS LSRGRVRASM NKYNLFNLYK KAPVRYDGKT LYQQKWNAKA ETRAYHGEHL 
TEKRWKAIFD PSLETVAQLD ASLKGSKVAP TPMTLQTYAS LEKRLELAVF RSMFASSVRQ 
AREFILGGSV SVNGVVIKHP SFPLKSGDIF HVKPEKVLLA MGRTKPSLEK AIKVDNQQIS 
AWNRYVKAAQ ENPREVWEAK QKKPASLNTI RNINGSESAE EFNKKIEQTM KSQQNDATRE 
SILLKIISLG RGIESNGGVV SAETFKEFNY DNESNSNNAQ KAHNVYKKLS DAKHKLIGEH 
NIENAAEFVN KKADDSESAA DKQLARSVKQ ILRELQKSTW EAIRVGAQQQ QSGKVLTASF 
TSDFVKSLVP HPALNKESIL EDETLANIKF PWQKSLFGRQ DPSKPYFTPW TPRPFIGAFA 
ILPSHIEVSF STCHAVYLRD PIARPGHSEV ISPFPDHTHE RAYMFYARKG L