Gene PICST_47138 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_47138
Symbol
ID	4839430
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	-
Start bp	1450419
End bp	1451894
Gene Length	1476 bp
Protein Length	467 aa
Translation table	12
GC content	42%
IMG OID	640390745
Product	conserved hypothetical protein
Protein accession	XP_001385280
Protein GI	150865886
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.440722
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.19959
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCTTC CGTCGAAATA TGCCCCGGAG GGTCTCAGTA GATATGACCA ACATCGACCA 
ATAACGTCCG GCAGAAAACG GCCTCAAAAG CCGATAAATT ATACGGTTCG TGTTATCGAA 
GCCAGAATTA AAGATGCTGT GGAGAACCGC ACCTACAATA ACTCAGACTA TGGAGATGGC 
GATATAGAAA TGATTCCTAT GGACGACTAT AAGGAAGTAG AGGTGATCTC CGAGTTTGTA 
GAATTCTGTC GAGATGCAAA GTTAATATCT GGCAACAGAA CGCTGGAGAC AGACGCGATG 
GAAGATATTG TAGAGAATAC TAGTGGCTTT GAGCTTGCAG AAGGTAACAT TTCATATCTT 
GTAATAGATA CCAATTTTCT TTTGTCCCAT TTAAACATCT TGGATGAGAT TAAAAACATC 
GCTGACAAAT ATGAGCTCAA GCTAGTAGTG CCTATCACTG TGATTCAGGA ATTGGATGGA 
CTCAAGAACT CCAATAGAAC AAGTCTCGTG AGCAGTAGCA CTAGCGGTGA GCTCGAAGAC 
AGAATATCGG GTAAGTCTAT AGGACATTTG GCTCGATGGG CTACTGACTG GATCTACTCG 
TGTCTTTCCA AGAACAGCGG TGTAGTCAAG GGCCAGAAAT TGAGAGAACG GCTCAATAAA 
GATGCTGTGA AAGACGATGC CATCCTCGAT TGTGCCTTGT ATTTGAAGGA ATGCCATGCC 
AATTCATTAA TCGTGCTCTT TTCCAACGAC AAGAACTTGT GCACCAAAGC TCTTGCAAAC 
GGAGTTCTTA CTGTAAGCTA TAAGAAACAC ATGACTTCAG AACTTATAGC GAATGTGGTG 
CATACCGAGA ATGTTAGTCG TTTTGGGAAA ATCGAAAAGC GTATCGTGGA AGTGGCTCCT 
GCTATACAGT CAATGTCTTA CTCTAATTCA AATTTGCAGT CTAATCCGCA GTATTTGCCA 
TCCCAATCGC TTTCGCAGTC TGATTCGCAA TCACATCTGC TTTCACATTC TCGTAAAAAT 
AGCCATGTGC TTGTGGAGCA GAATGTCCGC CAGTTTTCCA GCTTTCATCA GATCGCAGAA 
AAAGTATATA CCGAGATTCA GATGATAGCC CTATCTGCTA TCCATCAATG CATGGAGTCA 
GTATTTAACG AAGATCTAGA TCTTCTTCAG GACTACGAAA AAGAAAAAGT GATCACCCTC 
ACCGATTGTT CTAACGTTAT GATTCGGTTT TGGTTCACTG TATTTCAACC GTATTTCAAA 
AAACTCCCAA ACAAGTTCAC TCCGTTCGAT GAATCAGGAA GGAATAAAAC TCCACTATAT 
GTAGATTTAC CTAGAGATTC CTATGAATTG TTGCAATTCG TTCACTTCTG GACGAAGACC 
TTGTCTACCA TATACGCTGC CGAAATGGAC GACTCCAAAA ATGAAGCATT GGACATCCTC 
GTCCAACGAT GGGAAAGCAT GGCAAGCCTT TACTAA

Protein sequence

MSLPSKYAPE GLSRYDQHRP ITSGRKRPQK PINYTVRVIE ARIKDAVENR TYNNSDYGDG 
DIEMIPMDDY KEVEVISEFV EFCRDAKLIS GNRTSETDAM EDIVENTSGF ELAEGNISYL 
VIDTNFLLSH LNILDEIKNI ADKYELKLVV PITVIQELDG LKNSNRTSLV SSSTSGELED 
RISGKSIGHL ARWATDWIYS CLSKNSGVVK GQKLRERLNK DAVKDDAILD CALYLKECHA 
NSLIVLFSND KNLCTKALAN GVLTVSYKKH MTSELIANVV HTENVSRFGK IEKRIVEVAP 
AIQSMSYSNS NLQSNPHHVL VEQNVRQFSS FHQIAEKVYT EIQMIALSAI HQCMESVFNE 
DLDLLQDYEK EKVITLTDCS NVMIRFWFTV FQPYFKKLPN KFTPFDESGR NKTPLYVDLP 
RDSYELLQFV HFWTKTLSTI YAAEMDDSKN EALDILVQRW ESMASLY