Gene PICST_36494 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_36494
Symbol
ID	4840114
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	-
Start bp	6080
End bp	8092
Gene Length	2013 bp
Protein Length	629 aa
Translation table	12
GC content	40%
IMG OID	640391429
Product	predicted protein
Protein accession	XP_001385687
Protein GI	150866182
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.215422
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGCTA CTCCATTCAA AATACGGCAT ACCCGTATCT TGAAAGCGTG TGACAACTGC 
CGACAGAGAA AGATAAAATG CTCTGGCGAG TCCGTATGTT CTTATTGCAA GAAATATGGC 
GATCCGTGCA TTTATAGAGA GAAAACTAGA CAATCCAAAA AAGTGGTAGA TAGAGGGAAT 
ATTGACGTCG ATGCCACATC AACAGATTTG CATCAAAAGC CCGTCTCTCC AGGAAAGTGT 
GGACAGGAGG TTTTGGATAT GCCTACGTTC TTATCAGTTA GAAAATCCAG CGTCAATTCT 
TCCACAATGG AGTACTTTGG GCCCGCAAGT AACTTCTCTT TCGTCAACCA GTTGAACGAT 
TACTTGAGGT TGTTGGGTAA GAACACCACT CCTATTGACG AGGATCAAGG GTTGCGTAGA 
TTCGGAATGA ATTTGATGGT ATTATCCAAT CCTGCCGAGG ATTTTGACTG TACTTTAAGT 
ACGATATCAG TAGAAACGGT TAATCAGTTG ATCACAGCAT TCTTGGAAAC ATGGCATATT 
CCTTGCCCAA TATTTACCGG CGAAGACTTG TTTGATCTCT CTGTCACAAC ATGGAAACAG 
GGCTCTGCTC CCAAGCACAG AAAAGCTTTA TTATACTTAG TGCTTTCTAT CGGAGCAGCA 
GCATCTTACT TTGAGTCCAC CCATTGCAGT GCTTCATCAA CTTTGCCTCT TGCGAGAGGT 
TTCTTTGAGC TCTCGATTCG GACTGTTCCT GAAATATTCA CGGAGGTTTC TTTTGATGCA 
GTTAGAATAA TATTCCTTAT GAGCTTAAGT GCGTGTAATT TAGGTGATAC TGCCCAGTCC 
TATCTATACT CAGGCTATTC TGTCAGAATA GCAATAGCTC TTGGTTTACA TAAATTGACG 
AAATTCGAAT CTCAGCACCA ATGTCGAGTG TGGACTTGCG CTTGGCAATG GGAAAATTAT 
TGGAGTTTCT GCGTGGGACG TCCAAGTTGC TCAAGAGAGG ATATGCTGAT TCCTATGGTA 
CCAGAGGATG CTTTTACAGC ACTGGGATAT GGAAACAAGG ACAGATTTGC AATACATCAT 
CAGCATATGG AGCTCAGAGT CTATTTTGGA GCCAACTGCT CGAGGATTCA TTCGCAGCTA 
TATGACTCCG AAAGTGATTT GCTTGCAGTA TTAAAATCAG TGGAGAAGCT CTCCACTGAC 
ATTGACAACA AGTATTTGGG TTGCTCAGAT CCTTTATTGA AGGAATCCCA GGTCAGCGAT 
TTGCTTTTGC AAAATACCGA CGCTAATGCT TGTAGAGAAT GGTTTTGGAT TCGAATCTAC 
TATTTGTATT TGAAAATGGT CATATACCGA CCCTTTATGA TCTTTTATGC TTACTTGAAT 
AACTCTAAAA CAGAGGCTTC AGAGAAAATT ACTTTATTAC TAAAATCAAA GTCTAATCTT 
TGTGTACAAG TTGCTATTGA CATCTCAAGG TTCATTATAG ACTTGAATAG AAAGATTAAA 
ATGCGACAAC CCATTTTCTT TATCTGCACA TATTTGGAAA GTGCGTCTAC AATTCTACTC 
TTCTTTATTA TCAGTAATCG TGATAACATT CCGGACACTT TGGCAGAGAG CATTTGGGAA 
GTTCTTCAAG ATACATGCGC ATTTTTAAGT GGGTCGTCGG GACCCTATGT TGGTAGTATA 
AAGATAATTG CAAATGATGC GTTGAAATCC CTCCATGATA TTTTACTCTC AAATAACTCA 
GAGATTGCCG AGCGGACTTA TTTTGGAAAG GTTCTTCAAG GAGTGGTAAA ATGTGATGTA 
TTGGGAAGTA CCAATGATGT GGTAAATGAA GGAGTTTTGA AGGAAAGAAA CCTAGAGCCA 
AATCATTCAC CTGATTCAAA TGTACTCACA GAGCCTTCTT CAGATGCTAC AAGTCGATTT 
AATGCTGAAA AAGACGCACA GTTAGGCGAC ATGTCCACAT ATGGATTGGA AGACTTCTGG 
CAGCAAACTT TAGATTGGAT TAGCATTACA TAG

Protein sequence

MSATPFKIRH TRILKACDNC RQRKIKCSGE SVCSYCKKYG DPCIYREKTR QSKKVVDRGN 
IDCGQEVLDM PTFLSVRKSS VNSSTMEYFG PASNFSFVNQ LNDYLRLLGK NTTPIDEDQG 
LRRFGMNLMV LSNPAEDFDC TLSTISVETV NQLITAFLET WHIPCPIFTG EDLFDLSVTT 
WKQGSAPKHR KALLYLVLSI GAAASYFEST HCSASSTLPL ARGFFELSIR TVPEIFTEVS 
FDAVRIIFLM SLSACNLGDT AQSYLYSGYS VRIAIALGLH KLTKFESQHQ CRVWTCAWQW 
ENYWSFCVGR PSCSREDMSI PMVPEDAFTA SGYGNKDRFA IHHQHMELRV YFGANCSRIH 
SQLYDSESDL LAVLKSVEKL STDIDNKYLG CSDPLLKESQ VSDLLLQNTD ANACREWFWI 
RIYYLYLKMV IYRPFMIFYA YLNNSKTEAS EKITLLLKSK SNLCVQVAID ISRFIIDLNR 
KIKMRQPIFF ICTYLESAST ILLFFIISNR DNIPDTLAES IWEVLQDTCA FLSGSSGPYV 
GSIKIIANDA LKSLHDILLS NNSEIAERTY FGKVLQGVPN HSPDSNVLTE PSSDATSRFN 
AEKDAQLGDM STYGLEDFWQ QTLDWISIT