Gene PICST_31606 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31606
Symbol
ID	4838604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	+
Start bp	1238795
End bp	1240237
Gene Length	1443 bp
Protein Length	480 aa
Translation table	12
GC content	39%
IMG OID	640389919
Product	predicted protein
Protein accession	XP_001384192
Protein GI	126135336
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCGC TTTCGTTCAA TGTCTCGTAC AATTCCATTA CGAAAAAAGT GACTGTTCCG 
AGATCCAATA CTGTTCAACA GCTCATTGCC GTGAGTTTGG ACAAGTTTTC TATCAATTCA 
GGCAAGTATG GGGGCCAATT ATACCACAAC AATAAATTGC TAGAATCGTC TTTATCGCTT 
CGTCTCGCAA ATTTGATTAA CAACTCCAAA TTGACGCTTA AAACGACGAA TTTGGCTGCA 
TCTGCTCAGC AAATCAATGT AAAATTGATG ATTTCCAGCG ATTCTGAAGG TACAAAACAG 
ATTATCAATA AAGTGGACAG TAATGCAACT CTTCTTGAGT TATTGCAGCA ATTTGAAACG 
AGCGAAAATA TCCAATTGTT GACGAAACCA AGTCAATTGG GTATTTTGAG TGTGACGTAT 
CCTTCTGATA GCTACTCTTC TACCAGATTA GGTTCGCTTG TAGGTAATGT GTCGAATGTA 
GTAATCAGAT TCAACTACAC TATGGGTGTA GATACAGCAA AATTGAAACA GCAGGAACAG 
CAGGAATCAG TAAAGTTGCA ATTGAAACAA CAGCAAGAAA GGATCGCTAG ACAGAGAGAG 
GAAGAAAGAG CCAAGGCACA AAAAGAATTA GAATTACAGA AACAGCAAGA GCAAGATCAG 
GCATTGAAGG AAGAGGAGGA AGAGGAAGAG ACTCCGGAAC CTACTGAAAG TATCATAGAA 
ACAAAAGAGA AGCCTTCAAT TCCTTCTTCT ACTATTAATG CTGATTCTAT ATTAGAAAAA 
GAATCGTACC AATTTCAGAC TCCACAAATT GAGGAAACTC CGCTACTCTT TGTACCCGGC 
AACTCCAATT CTGCCTTATA TGAGAATCCA GATGAAGATT ACGAGATGAC GGTATCTCAG 
GCAAAGACGT ACCAGCAGCT AATCCAAAAT TCTGGAAAGA AGAGAAAAGC CAAGCAAATC 
AATAAACCTG TGAGGCTCTT AATTAGAGTC AAATTTCCAG ATCGGTCTAT TTTACAGATT 
AATTTTGTAA ATGATGTCGA CACCATAAAG TTGGGACATT TGGTTAAGAA AATCGATGGC 
TTGTTGAAAC CAGAATATAT CAATCATTAT AATATTAAGG CGGGATACCC CCCACAAACG 
ATTCCATTGA ACTTTGAAAA CAACAATACG TTTTTGGTAG ATATTCCCGA TTTTCAGAGC 
GAGAGAATCG TGTTAATCTG GGAGCTCTCG GACGGTGCAC CTAGTAAGAA TGGACCGTTC 
TTGAATGAGC AGCTTATTGA GGATGTTAAG ACATCAACGG ATTTACCTGA AGTAGTTCTT 
GAAAGTCATA GGGGAGAATT ACCTGATGAT GCGCATACTA AAACAAGAAC TTCTGGACAA 
GGATCTGAGG CCAAATCAGA GAGTAAGGGT AAACTAGTTC CTAAGTGGTT GAAGTTTAAG 
TGA

Protein sequence

MSSLSFNVSY NSITKKVTVP RSNTVQQLIA VSLDKFSINS GKYGGQLYHN NKLLESSLSL 
RLANLINNSK LTLKTTNLAA SAQQINVKLM ISSDSEGTKQ IINKVDSNAT LLELLQQFET 
SENIQLLTKP SQLGILSVTY PSDSYSSTRL GSLVGNVSNV VIRFNYTMGV DTAKLKQQEQ 
QESVKLQLKQ QQERIARQRE EERAKAQKEL ELQKQQEQDQ ALKEEEEEEE TPEPTESIIE 
TKEKPSIPSS TINADSILEK ESYQFQTPQI EETPLLFVPG NSNSALYENP DEDYEMTVSQ 
AKTYQQLIQN SGKKRKAKQI NKPVRLLIRV KFPDRSILQI NFVNDVDTIK LGHLVKKIDG 
LLKPEYINHY NIKAGYPPQT IPLNFENNNT FLVDIPDFQS ERIVLIWELS DGAPSKNGPF 
LNEQLIEDVK TSTDLPEVVL ESHRGELPDD AHTKTRTSGQ GSEAKSESKG KLVPKWLKFK