Gene PICST_68812 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_68812
Symbol	SIK1
ID	4851526
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	2064760
End bp	2066440
Gene Length	1681 bp
Protein Length	499 aa
Translation table
GC content	43%
IMG OID	640393234
Product	nucleolar protein involved in pre- rRNA processing
Protein accession	XP_001387632
Protein GI	126274754
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1498] Protein implicated in ribosomal biogenesis, Nop56p homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.116382
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0643077
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGCAGAACTC GAAATCATTA AAGACAACAT GGCTGGTTTG GACTATCTTC TCTTTGAAGA 
AGCTACCGGT TACGGGATCT TCAAGGTCTT GATCCAGCAG GATGACATCG CTTCTAGACA 
GAAGGAAGTA CAGGAAGCTT CCAACGACTT GGGCAAGTTC TCCAAGATGA TTGAATTGGT 
CTCTTTTGCA CCATTCAAGG GTGCTGCTCA AGCTTTGGAA AACGCCAACG ACATCTCTGA 
AGGTTTAGTA TCCGACTACT TAAAGTCAAT CTTGGAATTG AACTTACCAA AGGGTTCTTC 
TAAGAACAAG ATTGCCTTGG GTGTATCTGA CAAGAACTTG GGTCCTTCTA TCAAGGAAAT 
ATTCCCTTAC GTTGATTGTT TGTCCAACGA AATCGTCCAG GACTTCTTGA GAGGTATCAG 
AGTCCACGGC GACAAGTTGT TCAAGGATTT GCACGAAGGT GATATTGAAA GAGCACAGTT 
AGGTTTGGGT CATGCCTTCT CTAGAGCTAA GGTTAAGTTC TCAGTACAAA AGAATGACAA 
CCACATCATT CAGGCTATTG CTTTGTTGGA CCAGTTGGAC AAGGATATCA ACACCTTCTC 
CATGAGAGTC AAGGAATGGT ACGGATGGCA CTTTCCAGAG TTGGCCAAAA TTGTCCCAGA 
CAATTACACT TTTGCCAAGT TGGCTCTTTT CATCAAAGAC AAGGCTTCTT TGACTGAAGA 
CTCGTTGCAT GACATCGCTG CTTTGGTTAA CGAAGACTCT GGTGTTGCCC AGAGAATCAT 
AGATAATGCC AGAATCTCTA TGGGACAAGA CATCTCGGAA CAGGACATGC AGAACGTTTC 
AACTTTCGCT GAAAGAGTGG TAAACATCAG TGACTACCGT ACCAAGTTGT TCCAGTATTT 
AACAGATAAG ATGCACACTG TTGCTCCTAA CTTGTCGACG TTGATTGGAG AAGTTGTTGG 
TGCCAGATTG ATCTCTCACG CTGGTTCTTT GACCAACTTG TCTAAGCAAG CCGCCTCTAC 
TGTTCAAATC TTGGGTGCTG AAAAGGCCTT GTTCAGAGCT TTGAAGACTA AGGGTAACAC 
TCCTAAATAC GGGTTAATCT ATCACTCGTC TTTCATTGGT AAGGCTTCTG CCAAGAACAA 
GGGTAGAATT TCCAGATACT TAGCTAACAA GTGTTCCATT GCTTCCAGAA TCGACAACTA 
CTCGGATGAG CCATCTACTG CCTTTGGTGA AATATTAAAG AAGCAGGTGG AAGAAAGATT 
GAACTTCTAC GACACCGGTG CCCCACCTAT GAAGAATTCC GATGCCATTA AAGCTGCTTT 
GGCTTTAGGT GCTAGCGACT TGGCTGGAGT ACCAGCCTCC AACGAAGATG ACGAGCCTGA 
AACTCCTAAG AAGGAAAAGA AGGAGAAGAA GGAAAAGAAG GAAAAGAAGG AAAAGAAGGA 
AAAGAAGGAA AAGAAGGAAA AGAAGGAAAA GAAGCGTAAG GCTGAAGATG ATGAATCTCC 
AAAGAAGAAG AAGAAGTCCA AGAACTAGAT TATCACCTCT TTTTAAACAC TCGGCATTTC 
TCGACGACCT TCAATTCGTC AACCCCAGTT GCTTTTTTAT CCATTGTCTG GTCACGGCCT 
GATCGACAAT ATTATTGTAA ACTATAGTAC TTTCTATTGC ATGTTAATAT ACTAGATACC 
G

Protein sequence

MAGLDYLLFE EATGYGIFKV LIQQDDIASR QKEVQEASND LGKFSKMIEL VSFAPFKGAA 
QALENANDIS EGLVSDYLKS ILELNLPKGS SKNKIALGVS DKNLGPSIKE IFPYVDCLSN 
EIVQDFLRGI RVHGDKLFKD LHEGDIERAQ LGLGHAFSRA KVKFSVQKND NHIIQAIALL 
DQLDKDINTF SMRVKEWYGW HFPELAKIVP DNYTFAKLAL FIKDKASLTE DSLHDIAALV 
NEDSGVAQRI IDNARISMGQ DISEQDMQNV STFAERVVNI SDYRTKLFQY LTDKMHTVAP 
NLSTLIGEVV GARLISHAGS LTNLSKQAAS TVQILGAEKA LFRALKTKGN TPKYGLIYHS 
SFIGKASAKN KGRISRYLAN KCSIASRIDN YSDEPSTAFG EILKKQVEER LNFYDTGAPP 
MKNSDAIKAA LALGASDLAG VPASNEDDEP ETPKKEKKEK KEKKEKKEKK EKKEKKEKKE 
KKRKAEDDES PKKKKKSKN