Gene PICST_39422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_39422
Symbol
ID	4851871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	3057285
End bp	3058703
Gene Length	1419 bp
Protein Length	472 aa
Translation table
GC content	44%
IMG OID	640393579
Product	predicted protein
Protein accession	XP_001387152
Protein GI	126275867
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.423389
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGCTC TCGTTTCGCT CCCGATGATG GGTGCCTCTT CCTTGGCTTC GTGCTTCGGA 
GCTGCTGCCT GTTCTGCACT TTGTTCCACG ATAGGAGGCA CATTCCAATC GTCTATTATG 
ACCAGAATAA CATATGCCAT GTTGCTTTTA GTGAACTCAT TGATATCGTG GATAGCGCTA 
TCGCCGTTTA TTGTTCACAA AATCGAGAAA GCCACCTTCG GCTTTATCAA TAGCAAGTGT 
GGCCAAGATG GCTCTCAGTG TATTAGCTTT TCATCTGTCC ACAGAGTCAA CTTTGCTTTG 
GGGGTCTTAC ATTTAGTCTT GGCTGTGTTG TTGATAGATG TCAAGTCTAC AGCCAACCCT 
CGTGCAGTAA TCCAGAACGG GTGCTGGAGA ATCAAGATAT TCAGCTGGTT GACGTTTATT 
GTCATCAACT TCTTGCTTAT CCCCGATCAT TTCTTTGTTT TCTACGGTAA CAACATCGCC 
ATCATATTTT CCACCATTTT CTTAGGAATC GGACTTATCT TGCTTGTAGA CTTTGCACAT 
GCCTGGGCTG AGAAATGCTT GGAAAAGATC GAGTTAGAGG AATTGACTGG TGAAGGAGAT 
TCCTCTTTCT GGAAGAAGTT GTTAGTGGGA GGTACTTTGA CTATGTATAT TTCGAGCATA 
ATCTTAACTG TGCTCATGTA CTGGTTCTTT GCTGGAAACG GCTGTAGTAT GAACAAGACC 
GCTATCTCGT TGAACATGAT CTTTGGCTTA ATAATCTCAG CCATGTCTAT TAACCAGACT 
ATCCAAGAAT ACAATCCTCA CGCTGGACTT GCCCAATCTT CCATGGTAGT CTTCTATTGT 
ACGTATCTTG TCATGAGTGC TGTCGCATCA GAGCCAGACG ACAAGTTCTG CAATCCATTG 
GTAAGATCTA GAGGTACTAG AACTGCCAGT GTCATCTTAG GTGCCTTTTT CACGTTTATT 
GCAGTAGCCT ATACCACCAC TAGAGCAGCA GCAAACTCCG CTTTCAGCTC AGAACCAACT 
GCAGATCCTT ACATCAATGC CCAGCCAGCG GTTAGAAACG AAATGAGATA CCAGGCTATA 
AAGCAGGCTG TAGACGAAGG CTCTTTGCCT GAAAGTGCCC TTAACCAAAT GGACTTGTAT 
GACGAAGACA TGGAAGGCAA CAGCAACGAT GAAGAAAGAC AGAAAGTCAA GTATAACTAC 
TCATTGTTCC ACATTATCTT CTTTTTGGCT ACCCAGTATG TCGCTACGTT GTTGACTATC 
AACGTGAAGC AAGACGAAGT CGGTGACTTT GTACCTGTTG GCAGAACATA CTTTGCCAGT 
TGGGTCAAGA TTATTAGTTC GTGGGTATGT TTTGTTTTAT ACGGATGGAG TTTGGCTGCC 
CCTGTAGTTT GGCCAGACAG ATTTGGTGTT CAATTGTAA

Protein sequence

MGALVSLPMM GASSLASCFG AAACSALCST IGGTFQSSIM TRITYAMLLL VNSLISWIAL 
SPFIVHKIEK ATFGFINSKC GQDGSQCISF SSVHRVNFAL GVLHLVLAVL LIDVKSTANP 
RAVIQNGCWR IKIFSWLTFI VINFLLIPDH FFVFYGNNIA IIFSTIFLGI GLILLVDFAH 
AWAEKCLEKI ELEELTGEGD SSFWKKLLVG GTLTMYISSI ILTVLMYWFF AGNGCSMNKT 
AISLNMIFGL IISAMSINQT IQEYNPHAGL AQSSMVVFYC TYLVMSAVAS EPDDKFCNPL 
VRSRGTRTAS VILGAFFTFI AVAYTTTRAA ANSAFSSEPT ADPYINAQPA VRNEMRYQAI 
KQAVDEGSLP ESALNQMDLY DEDMEGNSND EERQKVKYNY SLFHIIFFLA TQYVATLLTI 
NVKQDEVGDF VPVGRTYFAS WVKIISSWVC FVLYGWSLAA PVVWPDRFGV QL