Gene PICST_89595 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_89595
Symbol
ID	4839361
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	-
Start bp	586873
End bp	588840
Gene Length	1968 bp
Protein Length	503 aa
Translation table	12
GC content	42%
IMG OID	640390676
Product	predicted protein
Protein accession	XP_001385121
Protein GI	150865774
COG category	[R] General function prediction only
COG ID	[COG2319] FOG: WD40 repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.136395
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTTTTTCAAA TCAAATTCAC AATTCAGTTC ACGGAATATC TATTCCATTA TTTCTCAATT 
CTGTACATAC ATGTACCATG AACGCGTCCA CCATAACCGT CCATTGGCAC AACGACAATC 
AGCCCATTTA CTCTGTGGAC TTCCAGCCCT CGGCATCTGG CCCTTCTCCT AGATTGGTCA 
CAGGAGGAGG AGACAACAAT ATCCGAGTCT GGAAATTGCA CCATAAACAT GACCAAGTAA 
ACCTAAATCA ACATGACCAA GGGGGCCAAT CTCAACAAAG TCAACAATAT CAAAATCAAA 
ACCTACAAAA TACAAGCGTA GAGTATCTCA GCACATTGAG AAAACATACA CAGGCTGTCA 
ATGTCGTCAG ATTTAATCCC TTGGGTACTA TATTGGCAAC AGCTGGTGAC GATGGAACGT 
TGATTCTTTG GAAACTCGCT GACCGGGTCT TGAAGGATTT TGAAGCGGAG GATGAAGACG 
ATGATGATGT TCAGGAGTCG TGGCAGGCTG TGTGTCAGTT CCGATCGTCG ACTTCTGAAA 
TCAATGATAT ATGCTGGTCG TCAAATTCCC GGTATTTGGT CACTGGTTCC ATGGATAACA 
TCACTAGAGT GTATCATATC GATTATGCCA ATGATAAGGT CACTGGTACT CTTGTGACAT 
CGAGCAAGAA CCATAACCAC TACATCCAGG GTGTCTACTG GGACCCACTT GACCAGTACA 
TAGTAACACA ATCAGCAGAC AGATCCGTCT GCGTATACAG AATCGTTAAG CATAAGAAGA 
AGGACGAGAT TGAAGACATA AAACTAGCAC ACAGATTCTT AAAATTTAAT AACCAGCACC 
TTTACCACTC AGAAACATTG CAATCTTTCT TCAGAAGGTT GTGCTTTTCA CCAGATGGAA 
GTTTGGTAAT AACACCAGCA GGTTTGGAAA GTGATCCTAA CACTCAAAAC GACGAAACGA 
CATCAACAAC TGAAAATCTC GAGTATGATT CTTCTAATAA TACCAACATT GACATCAATA 
ATATCAAAAA CAATAATAAC TCCAATAACA AGACAGACGA TTCGACCGCT ATCAACACTG 
TCTATGTGTA TTCCAGATAC AGTCTCTTGC ATACGCCCAT CTACAAGATA TCGAACTTGA 
ACAAGCCAGC TATTGCCGTG GCATTCAACC CATTTCTATA CGAGCCTAGT GCAACCAGTC 
CAGTTCTAAA GTTAGCCTAC AAGATGATAT TTGCCGTTGC AACCCACGAC TCGATCCTAA 
TATATGATAC GGAGAATTTC AAGCCTTTGG GTTACGTTTC CAACTTACAC TACAGTTCCA 
TAACTGATCT CAAATGGGAT TCCGACGGTA CAAAGATCAT CGTGAGTTCA ACTGATGGAT 
TCTGTCTGAT AATATCGTTT GATGACAATG TGTTCGGCCA GCGATATGCA AAGAAGGAAG 
AGAAATCAGA GGGTGTGCCT TTGACTGTTC CTGTCACTGA TCCTCCGACA CCTGTGGCAA 
CAAATTCAAG AAGCTTGACT CCTATCAACA ACCTAAAAGC TCTTCATTTG TCCAGTGATG 
TGGGGGAAAT AGAGGACTAC AAGTCGGATT TCGACTCATC GGAGGCAAAG GACGTAGAAA 
TGATACTGGG AGACACCAGT CCTGAAGTTG AAATAGTAGA GATAATATCC GAAGAAGAAA 
CTACGGATGT AGCTGCTCCT TCCATGGGAA CTATAGATAA GTTTTTCATG AGGCTGAAAG 
AGCTCTCGCC CAACAAGGAC AAGAACAAGC GTAGAGTTGT GCCTACATTG GTAAATAACT 
AGAAAGTGCT ATTTGTTATC TGTTAACATT AGTTAGCTAG TTAACGATAG ATAATAAGAA 
TACTAAGTTA ACAATACGTT AACCATGGGG TACTTAGTTA GAATTAGATA CCAGTTAGCA 
ACATTGAAAT ATGACGAGCG AGAACGGTCC TTCTCGTGAG GTGAATCT

Protein sequence

MNASTITVHW HNDNQPIYSV DFQPSASGPS PRLVTGGGDN NIRVWKLHHK HDQYLSTLRK 
HTQAVNVVRF NPLGTILATA GDDGTLILWK LADRVLKDFE AEDEDDDDVQ ESWQAVCQFR 
SSTSEINDIC WSSNSRYLVT GSMDNITRVY HIDYANDKVT GTLVTSSKNH NHYIQGVYWD 
PLDQYIVTQS ADRSVCVYRI VKHKKKDEIE DIKLAHRFLK FNNQHLYHSE TLQSFFRRLC 
FSPDGSLVIT PAGLENDSTA INTVYVYSRY SLLHTPIYKI SNLNKPAIAV AFNPFLYEPS 
ATSPVLKLAY KMIFAVATHD SILIYDTENF KPLGYVSNLH YSSITDLKWD SDGTKIIVSS 
TDGFCSIISF DDNVFGQRYA KKEEKSEGVP LTVPVTDPPT PVATNSRSLT PINNLKALHL 
SSDVGEIEDY KSDFDSSEAK DVEMISGDTS PEVEIVEIIS EEETTDVAAP SMGTIDKFFM 
RSKELSPNKD KNKRRVVPTL VNN