Gene PICST_31515 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31515
Symbol
ID	4838489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	989398
End bp	991734
Gene Length	2337 bp
Protein Length	778 aa
Translation table	12
GC content	38%
IMG OID	640389804
Product	predicted protein
Protein accession	XP_001384496
Protein GI	150865329
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.116727
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.678319
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACCC ATAGACTCGA AGATGAAGAA GATCAATTAT CACCAAGAAA GATAAGACAT 
ATGGACAATT TGTCGTCCTC AGACTCAGAA TCGGTGATGT CTACCTCTGA CAGCGTCGAC 
CCTGCAACTG GCAGCACGGG TAGCACCACT GTCTCCAGAT CTGGCAGCAC CGTAGGACTG 
GCGTCTGTTA GGTCAAGAAG AGCTTGCGAA AGATGCCGTC GTCGAAGAAC GAAATGCACT 
GGAGAACATC CATGCGAAGC TTGTATTGCT TCAGGGAACG AATGCTTGTT CCCCAGGAAG 
CCAAAGAGAA TTATGGTGTT CGACACTGAC ATTGAACAGT ATCAATCAAA GATCGAGACA 
TTGGAATTGG AAATTGAAAA ATTGAGAAAG GTGCCTGACA CTGACTATGA CCACAAGGCA 
GACAAGTTGA CTCTTTCAAT TTTGCTAGGT TCGCCTTCTT GTGAAATGGT ATGTTGGAAC 
TTGAACGAAT TTACCATTGC CAACAAGGGA ATCTTTAGCG ACATAACTGT GAGTCCTGAT 
TTCTCTACTT TTAGAGAAGA GATGTCTTAC AATTTCTTAT TCGGCAATGT TTCCAGGGGC 
AATGTTGATA TGGATTCAAT TAAGAATTTG AACTACGATA CTCTTATGCT GTTATACACC 
TACGTGGTTT CATTTATTAG TTCGGGGTAT ATGACCGTTG ACCACGAGAA CTTCGAAAAG 
AAATGCACCA AGTATTTCGA AAACGGTTTG TTTAAACCAT CAAGTGTTAA TTTCAAGACC 
AAAGTTGATT ACTTTTTCTT GAAGGTTTTG GCCCTTATGT CACTTGGCGA AATTTACAGT 
CCATTATATG TCCTTGGAGA AAGTAACGCA CCCGAATTAC CAGGACTCAA GTATTTCAAA 
ATAGTCATCA AGTATCTTCC ATCAGAATTT AGCTTCTTCG GCAATCGTGA TGTCAACGAC 
ACTTTGGAAA TAATTGAATT ATATTGCTTA ATTGCAATTT ATCTAAGAAT TTTGGATAAA 
AAGATTGCTT CGGTTCTGTT TACATTGCAT GCTTTACAAT TGTGCATTTC ATTAAATTTA 
CACAAGGACA GACATCTTAG GAGTTATGAA ATTAACGAGA AACCCCAACA TTATATCAAC 
AGAGTTTGGT GGGGAACCTT TTGCTTGAAC AGATTCTTCA GCTCAAGAAT TGGACAACCC 
GTGCTTGTCA GCATCGACAC AATAAGCAAC AACGCGTTAT TCGATGCCCC TCAACTTGCT 
CTTGAAGCAA ATAATTCTGT CAACAGTAGT ATGAAATGCT ATATTGAATT GTCTAAGATA 
GCGGACACAA TTACAAATGA GCTATATTCA ACATCATTCA ACAACAAACA ATATCTACAA 
TCCATCTTGT CTATCATGGC AAGGCTTTTT GACTGGAGTG CCAATATTCC CGAAAGTTTA 
AAATTGTCAT TTCCCATCAA AGAAACAGAG CCAATAAACA GATTAAGCTG TTCATTGTAT 
TTGAACTATT TACATCACAT CTACCTTACT TGCATTCCTA TACTATTGAA TTTTGCAAAG 
ATGCAAATAA GCACCTACTT CAAGTTAAAT CAGTTGATGT ACAATCCTCT CGTTATAGAT 
GATCTTCCAA AAAACATCAG CAGGATTATT CAGTCAATCA TAAATAGTGG GCACCTAACC 
ATGCATATTT TTAAGGCTTT ATACAAAGGG AAGTTTGTTC GGATTTTTGG ATTCACAGAC 
ATTGATTATC TTTTCAGTTC ATCATTGATT TATCTAATTT GCATAATTTT GAGAATTGAT 
CTGACTAATG AAAGGAGCCA TATTTTTCAA GAGCAATTGG AAAACTCTAT GGATTGGTTG 
AATCAAATGC AAAAAGGGGG GAACTTGATT GCAAGGGGAA AGCTTAATCA AATTGTTTCA 
TTGGTAGGTA ATCTCGAGCC AATGCTACTT GATTTGGGCC ATAATGTTTT GATACAAAAT 
CTCAAGAAAT ATAAAGAAGT CCGAACCCCA ACAAAAAGAT CACCACGCTC CAGTCACTCT 
GAAGGTTCAC TGATAGTTAA GAACCAAATT CCTAGCATTT TTACGCATAT GGAAAGGAGT 
GTCGGATCGT CAGAGTCACT TAATAAAGAT TTGAAATCCA AGCAAGCGTC ATCTTCCAAT 
ATTGTTATTT CCTCAATTGA ACTGGACCAA ACTGAGATAG TCGATAATCA CAGTCTATTC 
TCCTGGGATA TGTTTAACAA TCAAGATTTT CCAATTAGTC AACAGATAAT TGAAAACCAA 
GCACATTTTA GTCCAGTGAA CAACGATGAC TTAAGCATTT TCGATTTTTT TGAATGA

Protein sequence

MSTHRLEDEE DQLSPRKIRH MDNLSSSDSE SVMSTSDSVD PATGSTGSTT VSRSGSTVGS 
ASVRSRRACE RCRRRRTKCT GEHPCEACIA SGNECLFPRK PKRIMVFDTD IEQYQSKIET 
LELEIEKLRK VPDTDYDHKA DKLTLSILLG SPSCEMVCWN LNEFTIANKG IFSDITVSPD 
FSTFREEMSY NFLFGNVSRG NVDMDSIKNL NYDTLMSLYT YVVSFISSGY MTVDHENFEK 
KCTKYFENGL FKPSSVNFKT KVDYFFLKVL ALMSLGEIYS PLYVLGESNA PELPGLKYFK 
IVIKYLPSEF SFFGNRDVND TLEIIELYCL IAIYLRILDK KIASVSFTLH ALQLCISLNL 
HKDRHLRSYE INEKPQHYIN RVWWGTFCLN RFFSSRIGQP VLVSIDTISN NALFDAPQLA 
LEANNSVNSS MKCYIELSKI ADTITNELYS TSFNNKQYLQ SILSIMARLF DWSANIPESL 
KLSFPIKETE PINRLSCSLY LNYLHHIYLT CIPILLNFAK MQISTYFKLN QLMYNPLVID 
DLPKNISRII QSIINSGHLT MHIFKALYKG KFVRIFGFTD IDYLFSSSLI YLICIILRID 
STNERSHIFQ EQLENSMDWL NQMQKGGNLI ARGKLNQIVS LVGNLEPMLL DLGHNVLIQN 
LKKYKEVRTP TKRSPRSSHS EGSSIVKNQI PSIFTHMERS VGSSESLNKD LKSKQASSSN 
IVISSIESDQ TEIVDNHSLF SWDMFNNQDF PISQQIIENQ AHFSPVNNDD LSIFDFFE