Gene PICST_30814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_30814
Symbol
ID	4837787
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	+
Start bp	1010677
End bp	1012492
Gene Length	1816 bp
Protein Length	503 aa
Translation table	12
GC content	41%
IMG OID	640389102
Product	predicted protein
Protein accession	XP_001383479
Protein GI	150864596
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.018903
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.204154
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGAGTT ATGCCCCTGG CGGACACTCG TTGAAAGACA AATACAAAGA AGGCGGAAAG 
GCCAAGGAGT TGTTTTCCAA CCACGATTCG TTCTTATTCT CCAAAGAGTA CTTGGAAAAT 
GTGTTGGACG TCTCAAACGA CATGAAAGAC AGATTGCTGA ATTCGCACAA GAACTATGTC 
GACGTACAGA TGAAGAAATT GATAGAGGTA TACGGCTTGG ACACATTTGG CAACATTTTG 
AAAACAGACA CCGAGTGGGA CGACTACCAC GGCAGTTCTG GCTATGTATT GGTAGGAGGT 
GGAAAGTACA GTTTCTTGTC GTATCTTGTA ATCAGACAAA TCCGAGCTAC TGGAGCTAAG 
AAACCAATCG AGTTGTTCAT TCCAAGTAAG TTAGAATACG AAAAGGCTTT CTGTGAGACG 
ATTTTGCCTA AGTATAATGC CAGATGTAAC GTATTCGATA CGAAGTTGGC TGGTAACCTC 
AAGAAATCTT TCAATCTTGG AGGTTACCAG TACAAGATGT TGGCTCTTAT GAGCTCCTCC 
TTCGAAAGGG TAATGTATAT TGACTCTGAC AACTTCCCTA CTAGAAACAT GGATTATTTA 
TTCGACTCGG AGTTGTTCAA CGAGAAGGGG TTGATCTTGT GGCCCGATGC TTGGGCAAGA 
ACGACTAATC CTGTCTTCTA CGAAATAGCC GGAATCAAAG TCAAGGAGAA CAAGCTCAGA 
TACTCCACCT ACGATAAGAA ACAAGCCGAA AAGGAAGGAA AGCCATTAAA GCCATTGTCT 
GAATTTAGTT TCAAAGACTC ATGGTTCCAC GATTTCGAGG GAGCACTTCC GGATCCAACT 
TCGGAAACAG GCATGCTTTT GATTAATAGA ACGTCCCATC TCAAGACATT ACTCTTGGCC 
TTATACTACA ATGTTTATGG ACCATTCTAC TACTATCCCT TGTTGACACA GGGTTCTGCA 
GGAGAAGGTG ATAAAGAGAC GTTTATTGCG GCAGCCACTG CCATGCAGCA GACATATTTC 
CAAACATTGA AACAATTCAA ATGGACTGGC TATGTTTCAC AAAATGATAA CAAATTCACT 
TCGAAGGCTT TGGCGCACTA TGATCCCATT CAATCACAGG ATACGTCGAA AGATGACATT 
GATATCGTCT TCATGCATTT GTCGTATCCT AAGTACTATC CTAACTGGCT TGTGGATAAC 
CATGACTTGG TCTATCGTGA AAGTGGCGAC CATATTAGAA TGTACGAGTC GATCTATGAG 
AACGTTGGCT ACGATTTTGA TTTGCGCGTG TTACAATTCT TCACTCAGGC TATTTGTCCC 
AACTACTACG ATTCTCAAAC ATCGAAGGCC GTGGATGGAG AAGATATTGA TATGATGGAA 
GAATACATGG GTGACTACCT AGCTTATGTA GACGATGACG AAGAGCACAA CATCAACAGA 
TGTAAGGATG TTTTCATTCC TCACTTGCAA TGGTTGAAGG AAACCACCAA GTTCAAAGAA 
GGGCTGGTGA TAGTATAGTT ACAATAAAGA GACCTACTCA TATATAATGT CATAAATTAA 
TCGCTCCCTT ACAATTGACT TTTGCATCGC TTTTTAATTA TAATGAATGT AGTTCCACAG 
CAGTTAATGT AGAATAGTGA ACAGGAAAAG ATTCAGTGGA ATTTCAGAAC TCTTCCCAGG 
GTACCAAACA AGATCTACCT AAATGATTTT GCCATCACAT TATTCTCACT CCATTAAACG 
GCATCGGAAA GTAGTGATGC ACATAAAAGC AACCTGAAAT GGTGTCGAAT GTAGCTTCCT 
TTCATCACTG TCGTAA

Protein sequence

MESYAPGGHS LKDKYKEGGK AKELFSNHDS FLFSKEYLEN VLDVSNDMKD RLSNSHKNYV 
DVQMKKLIEV YGLDTFGNIL KTDTEWDDYH GSSGYVLVGG GKYSFLSYLV IRQIRATGAK 
KPIELFIPSK LEYEKAFCET ILPKYNARCN VFDTKLAGNL KKSFNLGGYQ YKMLALMSSS 
FERVMYIDSD NFPTRNMDYL FDSELFNEKG LILWPDAWAR TTNPVFYEIA GIKVKENKLR 
YSTYDKKQAE KEGKPLKPLS EFSFKDSWFH DFEGALPDPT SETGMLLINR TSHLKTLLLA 
LYYNVYGPFY YYPLLTQGSA GEGDKETFIA AATAMQQTYF QTLKQFKWTG YVSQNDNKFT 
SKALAHYDPI QSQDTSKDDI DIVFMHLSYP KYYPNWLVDN HDLVYRESGD HIRMYESIYE 
NVGYDFDLRV LQFFTQAICP NYYDSQTSKA VDGEDIDMME EYMGDYLAYV DDDEEHNINR 
CKDVFIPHLQ WLKETTNFLS SSS