Gene PICST_88664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_88664
Symbol
ID	4838363
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	763322
End bp	764922
Gene Length	1601 bp
Protein Length	468 aa
Translation table	12
GC content	44%
IMG OID	640389678
Product	predicted protein
Protein accession	XP_001383778
Protein GI	150864802
COG category	[A] RNA processing and modification
COG ID	[COG5228] mRNA deadenylase subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.64572
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.542479
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGTTA ATCCACATCT CCAGTATCTC CAGCTGCACC AACTCCAGCA GCAGCAACAG 
CCCATGAATG CTACCGGCCA GTCCCCGCAG ATTTCACAGC TCCAGTTGCA ACAGCACCAG 
TTACAGAGAC AACAGCTTTT GAACCATCAT CTCCAGCAAC AACACCAGCA CCAGCCCATA 
GGAACACCCA CAGCTCAGAA CGTCAGTACT AATCCTTTGT TAGCTGCAAT TAATGGAACT 
TCTAACGGAA ACGTCGTTCC AGGGAATGTA AATGGTCCAG GCTCAGGCTT GAACTCTGGT 
TTGAACTCTG GTTTGACCAC TGGAGCTCTG GTAAATCCTG TCTTACAATT ACAATTACAA 
CAGCAGAAAC AGCAACAGCA GCATCAGTTC CAGCAGTTAC AGGCAGCCCA TCAGGCAGCC 
CACCAAGTCC AACAGCAGAT TCCTTCTCAT CAGTTACATA ATCAGGCTCC TCTCATCAAA 
GAGGTCTGGG TGCAAAACTT GGAAAATGAG TTTCACACCT TACGAACCTT CATCAACGAC 
AAGACATCCA AGATCTTCAT CGCCATACAC GAGGAAATCC CGGGCATCGT AGCAAGACCA 
GTAGGCACGT TCAAGTCATC GTCTGACTAT CATTTCCAGA CGTTGCGTTC CAACCTGGAC 
TTGTTGAACT TGATCCAGTT GTCATTCTGT GTCACCAAGA TCAAAAACAA CGAGATCAGT 
TCCAGCATCA TCTGGCAGTT CAACTTCTTG TATGACTTGA CTAAGGAGAT GTTCAACGAA 
GAACATTTGA CCATGTTGTC GCAGTCGTCG CAGATAAACT TCCAGATGCA CATGACTCAG 
GGTATTCCTC ATTTTTCATT TGCTGAACTC TTGATTGAAA GTGGTTTGCT TTTGGACCTG 
TCCATCAATT GGATCAGTTA TCATGCTGGG TATGACTTGG GCTTCTTTGT TAGCTTGCTC 
ATCAACGATA ATCTTCCTGT CGATGAAAAA GACTTCTACT CCTGGTGCTC CAAGTACTTC 
CCCAACTTCT ACGACTTGAA GTATATCGGT AGCCAGTTGT TGAACACACC CAATGGCGAA 
GATACAGCTA AGGCTTCCAA TAATAAACCA TCCATAGAAT ATTTGGCTGA AGAATTGCAC 
TTATTGCCTA TCTCTCCTGC TATCCGTCAA CACTTTGCTG CGTCTATGTC ATCTCACTTT 
CCGGGCCATC AACAGCAAAT GACCTCTACT TTACATGCCT ACTTGTCAAT GGAGTGTTTC 
AAGGAGCTTT TGAGACAGTC GTCTTTTGAT CTTGCTTCGT TTTCACGCTT CAAGGGCTAC 
ATCTGGGGCT TGGGCAATTT GTATGGTAAC GGATCTGTAG ACGAGCAATT TCAGATCAAC 
GGGGCCATTC CTCAGCCCTC AACACCCTCG GGAGGCAACT CAAAAAGCGG TGTCGTTCAC 
TATGGAAGAC CCCTTTGACT TTTGTTGGTT GCTATGCCGC TTTTAGAACA AACTTGTACT 
TGTATGTTTT CCTTCTATAA TATTCTTCAT TTCCATGTAA ATTAGATATT GATTCTTGCA 
ATTAATATAT ACTATATACT ACACTATCCA AGCTCTATGA T

Protein sequence

MNVNPHLQYL QSHQLQQQQQ PMNATGQSPQ ISQLQLQQHQ LQRQQLLNHH LQQQHQHQPI 
GTPTAQNVST NPLLAAINGT SNGNVVPGNV NASVNPVLQL QLQQQKQQQQ HQFQQLQAAH 
QAAHQVQQQI PSHQLHNQAP LIKEVWVQNL ENEFHTLRTF INDKTSKIFI AIHEEIPGIV 
ARPVGTFKSS SDYHFQTLRS NSDLLNLIQL SFCVTKIKNN EISSSIIWQF NFLYDLTKEM 
FNEEHLTMLS QSSQINFQMH MTQGIPHFSF AELLIESGLL LDSSINWISY HAGYDLGFFV 
SLLINDNLPV DEKDFYSWCS KYFPNFYDLK YIGSQLLNTP NGEDTAKASN NKPSIEYLAE 
ELHLLPISPA IRQHFAASMS SHFPGHQQQM TSTLHAYLSM ECFKELLRQS SFDLASFSRF 
KGYIWGLGNL YGNGSVDEQF QINGAIPQPS TPSGGNSKSG VVHYGRPL