Gene PICST_83076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_83076
Symbol
ID	4839045
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	863611
End bp	865467
Gene Length	1857 bp
Protein Length	470 aa
Translation table	12
GC content	40%
IMG OID	640390360
Product	predicted protein
Protein accession	XP_001384467
Protein GI	150865310
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.569663
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTTTCTTTTT ATATTTGATT TACTGAAGTG GTGGACATAC TATTTGTGAA CAAAATCTAC 
CAATTTAAAA ATCGGCTTTC CTTATAAATT TTTGTCTTGC CTATGACATT TGGCATTCAA 
TAAAAGTGAA GAAGAGGAAG ACCAAGGAAT ATTGAAATAC AACAACTTAA ACAAGTAGAT 
AAGAGATACG AAAAGTGCAA GGATAATAGC AAGATAACCT TCAGAGATGT CAGAACTATC 
AAGCAGCAAC TCTTCGGATG GTTCTGAGTC ACAGAGCATA AATGATGTCA CCAGTGTCAA 
TGTAAAGTAT GATGATTCTG TAGAAATCAA GTCTTATGCT ACTTCGTTTG ATTTATTGAC 
TCTGGAGTCT AGACCTGATC TCAGAAATAC CAAATATAAA TCTTCTACCG ATCATTTGAA 
TTGTCCCATT TGTCAGCAAC CTTTTATGGA GCCTTTGACT ACGATCTGTG GCCATACTTT 
CTGTAAAGAA TGTATCTATG AATGTTTGAA AATGGCGAAA AGCAACCAGC AGAGCTCTGG 
CAGCGATAGT TTGTCAGGGT ATTGTCCACT TGACCGGACG CCAATTGACT CCGCCAACAT 
AAATGATTTG TTTCCTACTC CATTGTTGAT TTCCAACTTG ATTGACGACT TGAAAGTGTA 
CTGCTTGAAT CACGAAAGAG GCTGCGAATG GGATGGAAGT CGCTGGGAGC TCGAGCGTCA 
TGTTTTGATA GATTGTGGAT TTACAGGAGT GAAATGCGGA GGTGTCAGAT ACGAGAATAG 
TGATGTTCGA CAAGAATCTA AAGAATCTGT GCCAGAAAAT GCTGTTTGCC AGTTGCTTAT 
AGAGAGAAGG TTTGCTGACG AAAACCATGG CTGTTCCCAC CAGGTATTTC AGTGCAATTT 
CTGTAATCAG GAACTCACCA AGATGACTGA AAGTGACCAT TTGGAAAATG AGTGTTTGTT 
CAATTATCAG ACATGCGAAT TGTGTTCCAA CGATATGATT CCCTTGAAGA ACTTGAGCAA 
ACACCAGGAG AATTGCTCCA AGATTGGTAT GGTCAAATGT CCTGCTCACG AGATAGGATG 
CAAGTGGGTT GGATCCAATG AAACTTCGCT AGAGATTCAT CAACAGGGCA ACAACTGTCA 
GCTTAGCCAT TTCTTACCTT ACTATCACAA GATAAACGAC AAGGTGGATC TGCTTACAGA 
GGAGAACAGG TTCTTACAGA AACAAATCAA CAAGATCTTG GACTCAATCG TTCAAGGAAA 
GATTACTAAT TTGGGCTACA ACGAGTCTAT CGAGGAGATC AACAAGTTCA AGACAATCGA 
AGACCAGGAC AAGCTCTTGT ACCTCAACTT TGAGATTGAT AGGTTGAAAT TTGAGTTTAA 
CGAGAAGATC ATGCCGTTCA TCAATAAGCA CACCATGAAT GAACAGGAAA CTGTGATCAA 
CAATTTGACT CACGACAACT TCATGATGAA AGAAGACTTA AATTTGCAGA GGGTGTTAAT 
CAACAGCTTG AGAAAACAGT TGCAATTCCT TTTGTTCTCG CGCAACAGTG CCAGAACCGG 
GGCATTTGGT ACAGGCGGCA TGGTGGGCTC GATGGGAGCA GCTCCTAATG TTCTTCTTAT 
GGATGACGTT GCCAACGAAC TTCTTGAAGC ATCTTCACGG AGCAGTTCCG AGGAGCGGTT 
GAACTTGAAA TTGTAGCACT AGCAAACAGA TCAAGAGAAT GCAATCAGAA AAGGAAAGTG 
TTGCGATTTG GATTTTTATG ATTTACGAGA GAAGATTACT AGCTGATAAC GAAAATGACA 
TTACTGACGT TTCTGAGTTA GCGACGACAT ATAGATAAAA ATTTAATAGA ATGGATT

Protein sequence

MSELSSSNSS DGSESQSIND YDDSVEIKSY ATSFDLLTSE SRPDLRNTKY KSSTDHLNCP 
ICQQPFMEPL TTICGHTFCK ECIYECLKMA KSNQQSSGSD SLSGYCPLDR TPIDSANIND 
LFPTPLLISN LIDDLKVYCL NHERGCEWDG SRWELERHVL IDCGFTGVKC GGVRYENKNA 
VCQLLIERRF ADENHGCSHQ VFQCNFCNQE LTKMTESDHL ENECLFNYQT CELCSNDMIP 
LKNLSKHQEN CSKIGMVKCP AHEIGCKWVG SNETSLEIHQ QGNNCQLSHF LPYYHKINDK 
VDSLTEENRF LQKQINKILD SIVQGKITNL GYNESIEEIN KFKTIEDQDK LLYLNFEIDR 
LKFEFNEKIM PFINKHTMNE QETVINNLTH DNFMMKEDLN LQRVLINSLR KQLQFLLFSR 
NSARTGAFGT GGMVGSMGAA PNVLLMDDVA NELLEASSRS SSEERLNLKL