Gene PICST_42021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_42021
Symbol
ID	4837189
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	540849
End bp	542450
Gene Length	1602 bp
Protein Length	533 aa
Translation table	12
GC content	39%
IMG OID	640388504
Product	predicted protein
Protein accession	XP_001382862
Protein GI	150864148
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GACCGTAAGA GAGAAAGAGA TTCGTATTCT CCGAGATATG AGCCCAGGAA AAATGAACAT 
AGATCTGGAA ATCGCGATCG TAGCCCGCGG AGAACAGATT CGTATAGAGG CGACCACAGA 
GAAAGAGACC ATTACCGAGG CCAATATAGA GAACGCAGGG ATATCCGAGA GAGAGAAATA 
CCCGACTCAC CGTCTTCCAG AGATCTGTCT ATGGCGAGAG AAAAACTTAC AGAAACAAGT 
AAAAAGGAAG AGTATTCCAA GAATGAGTTG CAAAAGAAGA TAAAAGAATT ATCTCAGCAA 
TTGTCTGCTT TGAATGATGT AGAGTCAATT GAAGATAAGA CAGTCATAGA CTCACGTTGG 
GGAGTTAAGC CCAAAGGTTT TGAAGAAGTT ACAGCGCAAA GAGCAAAGCT TTCTGGATTA 
TTCCCTTTGC CTGGATATCC GAGACCGGTA GATTTCACTA AGTTAGAGGG TATGGTTAAA 
GACAGATCAA ACAACAAGAA CGACATCTTG TTTGAAATGT CTCATATTGA CCCTGTAGAT 
GCTAAAAGTT CTAGACTTTT GATTCTCCAT GGTGTCGACT TTGACAAAAT AAACCACTTG 
AAGGTGGTTG ACTACCTTAA CAGCTACTTG AAAAAGATAG ATATTGAAGA AACTTCTTTA 
TCCAACAACA TTGACGACAA AAGAAAAACA AAAGATGACA AGAGTTTGAT CGTAGAGTTC 
CACAATAGTA CTTGTTGTAC TATTATATCA TCGCTAGTAA AACTTCAGCT CAAATTTAAT 
GAGTTCAAGG ACGATGCAGA GCTTGCTCAT CACGAAGAGG AGACGTTTAC AATTAAGTTT 
GAAAGGCCCA ACGAATACGT GGTTCAAACT TTACCTCCTT ATACCAAACA AGATGAAGAC 
ATAAAAGAGA AAGTAGTTGA TTCACCGAGA AAAATTACCC TAAAGTTTTC GCCTGAAACC 
ACTGAAACAC AAATAATTAC TGAATTGAAT CTTTATTCGC CAGTAAGAGC CTTCCAAATG 
TTCAGAGAAG TTGGTACCAA AGTATCGTTG GGTATGGCAT TTGTTGAATT TTTCATTGAT 
CCGGCCTCCT ACAAGCACAC CGATCAAGTT ATTGAAAGAC TCCAAGAACT ACTTCAAAAG 
CTTGATCAGT CTCAAATAAT CGACGAAGCA TTCTTTTCGT GTATTATTCC ACACAAAACG 
AGTATCCAAG ATTGCCAAAT CAACTTTGAT AGTTTGAAAC ACTTGGTGAG AAACGAGAAT 
GTGTCCACAC ATCCTAAGCT GAGAGTTATT CAGTTGCTCA ATGTTGTTAC TCCGAAAGAT 
TTAGTCGAAG ATTCCAATTA CCAGTTTATA TTGAAAGATA TTAAAAGAGA AGCTTCACGA 
ATTGGAACTG TGGTATCAAT CAAGATTCCC AGACCTGCCA ATGAATTCAC GCCAGGTTTG 
GCACAATTCA GTGTTCCTGG TCTAGGCAAA GTGTTCATCG AATTTGAAGA CGAAGAAGTG 
GCTTTTAGAG CTATCATGGA GTTAGCTGGA AGGCTGTATA ACGACCGCTG TGTTATCTGT 
GCTTTCTACA ATGTCGACGA CTACAGAATG GGATTGTACT AG

Protein sequence

DRKRERDSYS PRYEPRKNEH RSGNRDRSPR RTDSYRGDHR ERDHYRGQYR ERRDIREREI 
PDSPSSRDSS MAREKLTETS KKEEYSKNEL QKKIKELSQQ LSALNDVESI EDKTVIDSRW 
GVKPKGFEEV TAQRAKLSGL FPLPGYPRPV DFTKLEGMVK DRSNNKNDIL FEMSHIDPVD 
AKSSRLLILH GVDFDKINHL KVVDYLNSYL KKIDIEETSL SNNIDDKRKT KDDKSLIVEF 
HNSTCCTIIS SLVKLQLKFN EFKDDAELAH HEEETFTIKF ERPNEYVVQT LPPYTKQDED 
IKEKVVDSPR KITLKFSPET TETQIITELN LYSPVRAFQM FREVGTKVSL GMAFVEFFID 
PASYKHTDQV IERLQELLQK LDQSQIIDEA FFSCIIPHKT SIQDCQINFD SLKHLVRNEN 
VSTHPKSRVI QLLNVVTPKD LVEDSNYQFI LKDIKREASR IGTVVSIKIP RPANEFTPGL 
AQFSVPGLGK VFIEFEDEEV AFRAIMELAG RSYNDRCVIC AFYNVDDYRM GLY