Gene PICST_42488 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_42488
Symbol
ID	4837223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	+
Start bp	2279215
End bp	2280618
Gene Length	1404 bp
Protein Length	467 aa
Translation table	12
GC content	44%
IMG OID	640388538
Product	predicted protein
Protein accession	XP_001382667
Protein GI	150863998
COG category	[R] General function prediction only
COG ID	[COG2319] FOG: WD40 repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.206932
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG ACAAGTCCCA GATCAAGATT AAGTTCTTCA CGAACGAAGA AGATGTCTCG 
TTGCAAGTTT CAGATGCTCC TTTGTATGTT CCAGTGTCAT TGAAGAGATA TGGCTTGTCA 
GAAGTAGTGA ACCAGCTCTT GGGAAACGAT GGGGAGAATG ACGATTCGAA GCCAATACCG 
TTCGATTTCC TCATAGATGG TGTATTGTTG CGTACTTCGA TCCAGGACTA TTTGACGAAA 
AATGGACTTT CCAGCGAAAC GTTCTTGTCT TTAGAATACA CAAGAGCTGT ACTTCCACCT 
TCTTTCCTTG CATCTTTCAA TAACGAAGAT TGGATTTCCT CTCTTGACAC GATAAACAAG 
ACTTTGCCCA GCGTTACATT GTCGAACATG ATGATTTCAC AGCCCAAGAT CTTGTCCGGC 
TCATATGACG GTATAGTTAG AACTTACAAC ATGTCTGGAA ATGTAGAGAA GCAATATGTG 
GGCCATTCTG GTCCCATTAG AGCCGTCAAG TGGGTTTCAC CTACTAGAAT CGTTTCGGCT 
GGTAACGACA GACAAGTAAG ATTGTGGAAA ACGTCTGCTG ACGATGGAAG TATACCCGAA 
GAGGACGAAG AAGCTGAAGA CGGTAGAACG TTGGCTATTT TAGAGGGTCA CAAGGCTCCC 
GTAGTGGCAT TGGCTGTCGA AAACACTTCC AACAGGATAT TGTCTGCTGG TTACGACCAT 
TCTATTGGAT TCTGGTCTAC AAACTATAAG GAAATGACGA CTATACAGCC TTTAGAATAT 
GATTCTAATG TTTTATCATC GTCGTCCAAG AAGAGAAGAA AGATGGCTCT TCAAGATTCG 
ACTATTAGAC GTCGTTCTCC ATTGGCTCTT TTGGATAGCC ACACTCAACC TGTAGAAGAT 
GTTATTTTCG ACAACACCGA CGCCACCGTT GGTTACTCTG TATCCCAAGA TCACACCATC 
AAAACATGGG ATTTGGTTAC TTCTCGTTGT ATCGATACCA GATCTACCGG CTATTCATTG 
CTCTCTATCG TGCAGTTACC CAAACTGAAG TTGTTGGCTA CTGGTTCTTC TGCTCGTCAT 
ATCAACTTGC ACGATCCCAG AATATCCAAC AACACCACGG AACAGACCAC TTCCAAACTC 
GTGGGCCATA CAAACTTTGT GGTCAGCTTG GCTGCTTCAC CAAATAATGA TAACATGTTT 
GCATCTGGTT CCCACGATGG CACTGTCAAG GTTTGGGACA TAAGAACAGA TAAATCTTTG 
TACACTATCA CTCGTGAATC ACCAGAAGCT GTCAAGGGTG CCGACAAGGT GTTTGCAGTT 
TCGTGGGACA ACGAGATCGG TATCATCAGC GGTGGCCAGG ATAAGAAGAT CCAAATCAAC 
AAGGGTAGCG ACATATCTAA GTAG

Protein sequence

MSDDKSQIKI KFFTNEEDVS LQVSDAPLYV PVSLKRYGLS EVVNQLLGND GENDDSKPIP 
FDFLIDGVLL RTSIQDYLTK NGLSSETFLS LEYTRAVLPP SFLASFNNED WISSLDTINK 
TLPSVTLSNM MISQPKILSG SYDGIVRTYN MSGNVEKQYV GHSGPIRAVK WVSPTRIVSA 
GNDRQVRLWK TSADDGSIPE EDEEAEDGRT LAILEGHKAP VVALAVENTS NRILSAGYDH 
SIGFWSTNYK EMTTIQPLEY DSNVLSSSSK KRRKMALQDS TIRRRSPLAL LDSHTQPVED 
VIFDNTDATV GYSVSQDHTI KTWDLVTSRC IDTRSTGYSL LSIVQLPKSK LLATGSSARH 
INLHDPRISN NTTEQTTSKL VGHTNFVVSL AASPNNDNMF ASGSHDGTVK VWDIRTDKSL 
YTITRESPEA VKGADKVFAV SWDNEIGIIS GGQDKKIQIN KGSDISK