Gene PICST_31470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31470
Symbol
ID	4839020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	+
Start bp	887354
End bp	888397
Gene Length	1044 bp
Protein Length	347 aa
Translation table	12
GC content	44%
IMG OID	640390335
Product	predicted protein
Protein accession	XP_001384122
Protein GI	150865065
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1097] RNA-binding protein Rrp4 and related proteins (contain S1 domain and KH domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGTCA GTGAGGTCAT CTCCATCACC AAGCCTGTTG GACTTGACAA TGACATAGAT 
TCAGATGTTG AAATGTCAGA TTCGGAAAAC CAGGCTCAAG ACTCGTTCAA GCAGTCTATA 
GTAACACCTG GGGAGTTGGT GACGGACGAT CCCATCTGGA TGAAAGGCCA CGGGACGTAT 
TTCCTCGAGG ATAGGACATT TTCGTCTGTG GCTGGGAATA TTCTGAGAGT GAATCGTTTG 
TTGAGTGTAA TACCGTTAAA AGGCAGGTAT CAGCCTGAGA CCGGTGACCA TATTGTAGGC 
AGAATCACAG AGGTAGGCAA CAAAAGATGG AAGGTCGACA TTGGAACTAA GCAGGACGCT 
GTTTTGATGT TGGGATCTGT CAATTTACCT GGAGGTGTAT TAAGAAGAAA ATCCGAGAGT 
GATGAATTGC AAATGAGAAA CTTCTTGAAG GAGGGAGACT TGTTGAACGC AGAGGTACAG 
ACAATTTTCA ACAACGGCAT TGCGTCGTTA CATACGCGTT CATTAAAGTA CGGAAAATTG 
AGAAACGGGA TGTTCTTGAA GGTACCAAGC AGTTTGGTAA TCAAGTCAAA GAATCACTCG 
TATGATTTGC CAGGAAATGT CAGTATAGTA TTGGGAGTTA ATGGCTATAT CTGGCTCTAC 
AAGACATCTA CAGGCATCAA CAGCGCTACT AACACTAGTG TTACATCTAA TACCAACATG 
TTCCGGGCCT CTGTCGACAC TACTGGTTCG TATGCTATCG GGCAGGGTTC GGTTTCTATT 
ACTAGATTGG AAGAAGAAAG TTCGTGGGAA ATTTACTCAG ACAAAAACGA TCCAAATATC 
TCCAACTCTG TACGTTCTAA CATTACTCGA TACAACAACG TCCTCCGGGC AATGAGCTTC 
TGCGAGTTGG GGATAACAGA ACAGCGGATT ATCATGGGCT ATGAGGCTAG TTTGTCGTAT 
TCGAATATAG GCAGTTTGAT AGACAAGGAG TCGATGGAGA GCATTTGCCA GGATATCATA 
AATAACGAGA AGATGAGAGG TTAG

Protein sequence

MNVSEVISIT KPVGLDNDID SDVEMSDSEN QAQDSFKQSI VTPGELVTDD PIWMKGHGTY 
FLEDRTFSSV AGNISRVNRL LSVIPLKGRY QPETGDHIVG RITEVGNKRW KVDIGTKQDA 
VLMLGSVNLP GGVLRRKSES DELQMRNFLK EGDLLNAEVQ TIFNNGIASL HTRSLKYGKL 
RNGMFLKVPS SLVIKSKNHS YDLPGNVSIV LGVNGYIWLY KTSTGINSAT NTSVTSNTNM 
FRASVDTTGS YAIGQGSVSI TRLEEESSWE IYSDKNDPNI SNSVRSNITR YNNVLRAMSF 
CELGITEQRI IMGYEASLSY SNIGSLIDKE SMESICQDII NNEKMRG