Gene PICST_29180 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_29180
Symbol
ID	4851912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	3160762
End bp	3162279
Gene Length	1518 bp
Protein Length	505 aa
Translation table
GC content	42%
IMG OID	640393620
Product	predicted protein
Protein accession	XP_001386933
Protein GI	126276000
COG category	[R] General function prediction only
COG ID	[COG2319] FOG: WD40 repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.648326
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTAG TGCAGGGGTA TAGTTCTAGC GAAGAAGAAG GGGTCCAATT GCCCCAGTTG 
CCGGTATATG ATATTCGGAC CTATAGCGAG AAACACTCTG CGAAATCTGA GAATGAGTCT 
GAAGCTATAG CCACTGAAAA TTCGAGGAAA AGAAAGGCTT TTGGAGCTAC TATTGAAGGT 
GCTTACTATG ACAGAGCTAC ATTTGAACTC CAAGCGAAAT TGGAGCGAAG AAACAAACTG 
GCATCGCAAG AAGTGAAACT GAAAGCTAGG AAAATCAAAA AGAAAAGGTC TAAGAACGGA 
AGCGATGACG ATTATTTAGG ACCCTGGGCC AGATATGAAA GCGAGTCTGA AGATCTAGAT 
CAAGAAAATG AAGCTGAAGT TAAAACTGAA GAATATTACA ATAATGACAA GAAGAATGAA 
CAGGAGAGTG ATAATGAAGC TTCCAATGTA GGCTCTGATA ACGAAAATGA AAATGATCCA 
AAGTCAACAA CTGAGTTTTT GGGTTCACAA GAACACGATT ATCTTGGACG AACTTATATG 
CATGTATGGC GAGACTTGCC TATTGATCTA AGCAAAGAAC CAAGTACTCA CGAATGCTTC 
GTTCCCAAGA AAGTCATCCA TACATTCCTG GGACATCCCA GGGGCGTCAA CAAGCTTGAA 
TTCTTTCCCA AATCGGGACA TCTTCTTCTA TCTTGTGGTA ACGACGGAGA AGTCAGACTC 
TGGGACTTGT ACCACAAATT TGAGCTTCTC AGGGTGTTTC ATGGCCACAG TCAAGCTGTA 
AAGGATGTTA CATTCAACTC GTCTGGCACT GAGTTTCTAA GCTGTGGGTA CGACAAAAAA 
GTTATTCTTT GGGACACCGA GACGGGTGAA ATTAAAAAGA GTCTACGAGT AAAGGCTATT 
CCGAATGTTC TTCGATTCAA TCCCAAAAAT GAAGACGAAT TCATAGTAGG ATTAAGCAAT 
AACGATATTG AGCACTATGA TCTTTCTTCT TTGGACTTCC ATACTCCCGT TCAAACCTAC 
AATCACCACT TAGGAGCCAT CAATTCTTTA ACTATTATCG ATGATAACAA TAAATTCATG 
TCTACAGGTG ACGACAAAAC AGTACGGTTC TGGAATTGGC AGATCAACAT TCCCATCAAG 
TTCATTTCCG ATCCGTCACA GCATTCTATG CCTGCCGCTG CAATTTACCC TGGAGGTAGC 
TTCATAGCGT TGCAGAGTAT GGACAATTCG GTAAAGGTAA TTCAAGGACA CGGAAAGTTC 
CGGTTCAACA AAAAGAAAAC TTTCCGAGGC CACAATGTTG CTGGTTACGG AATCGGTCTC 
GATATCTCGC CAGATGGTAA GATCCTCATG AGCGGCGATG CCAAGGGGTG TGGCTATTTT 
TGGGATTGGA AGACTTGCAA GCTTGTAAAG AAGTTGAAGG TTTGCGATAA ACCCATCAGC 
TGTATCAAGT TCCATCCCCA GGAATCTAGC AAAGTTGTTC TAGCAGGAAT CACAGGGGAA 
ATCTATTTCT GTGATTGA

Protein sequence

MSLVQGYSSS EEEGVQLPQL PVYDIRTYSE KHSAKSENES EAIATENSRK RKAFGATIEG 
AYYDRATFEL QAKLERRNKL ASQEVKLKAR KIKKKRSKNG SDDDYLGPWA RYESESEDLD 
QENEAEVKTE EYYNNDKKNE QESDNEASNV GSDNENENDP KSTTEFLGSQ EHDYLGRTYM 
HVWRDLPIDL SKEPSTHECF VPKKVIHTFL GHPRGVNKLE FFPKSGHLLL SCGNDGEVRL 
WDLYHKFELL RVFHGHSQAV KDVTFNSSGT EFLSCGYDKK VILWDTETGE IKKSLRVKAI 
PNVLRFNPKN EDEFIVGLSN NDIEHYDLSS LDFHTPVQTY NHHLGAINSL TIIDDNNKFM 
STGDDKTVRF WNWQINIPIK FISDPSQHSM PAAAIYPGGS FIALQSMDNS VKVIQGHGKF 
RFNKKKTFRG HNVAGYGIGL DISPDGKILM SGDAKGCGYF WDWKTCKLVK KLKVCDKPIS 
CIKFHPQESS KVVLAGITGE IYFCD