Gene PICST_31869 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31869
Symbol
ID	4839577
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	+
Start bp	92815
End bp	94662
Gene Length	1848 bp
Protein Length	587 aa
Translation table	12
GC content	37%
IMG OID	640390892
Product	predicted protein
Protein accession	XP_001384672
Protein GI	150865450
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGACT CGGAAGATAG TTCCATTGAC ATAAATGAAT ACTCGATCCG TGATTACTAC 
AAATTGCTTC GCCCTCTATG GGCTGCAAAA AATATCAATG CCAGTTATTT AAATAACCAT 
AAGTTACTCC GCACTTTAGT CGATTTCTCG TTAACACATT CATTATACCT CAAGAATCTT 
CAAAAGAGAG AATTAGAACT TGGTGATATA ATTCCCACAA AAATTAATTA TGTCGACGCT 
CTAGTAATCA AGACTCCCAA CAATAACAGT TTAAATAACA CAGAACACGC TTATCAATAC 
TATGGATGTT TCAGAAATAA ATTCGTGGAA TTTTGTCCTC ACTTGGCCAT AGCAGTCTAC 
TTGTTCAGTA GATTCCATAT TCCAGATGAG TACGGATCAC TTGAATTCAT GGTCTCGGAC 
TACAAGAACA AACTCTCCCT AGAAGATGTC AAGCTATTGA AAGGAAACAA TAAGCTATCC 
GCCATATCTT ATAGTCAACA ACATAAATCG TCCATCAATG CCCTAAGCCT AAGTGGTTTA 
AACTATAAGG ATATCAACCT TAATAAACTT TTAGTCACTC AAACTTTAGA CATTCAAGAA 
AAGTTAGTTC TGTTGGACAT TGACCATCTT CCTCATCTGG TCATGTTGAG CTTGGCCGGT 
TTCGAATCTT TCACTGACTA CAATATAGCA AGAAATTCAG TAGAACCTCC ACAGGAATTG 
CTTGAACAAA TCTTCCCTTT CATCAATAAG CCAAATCCAG AAGAGTCTTT GGCCATGACT 
AGAATCAGAC AGTTATTGAT GATGCTTAGA AGGACCTTGT GTCAAGATAT GGTTATAATC 
AAGAAGAAAT ATCCATCTAA TCCAGTTTCC AGAAATCCAA TTTTCAGCTC GGAATTATTT 
ACCAACTTCT GCAATGAAGT TGAAGCTGCT GGGATAATCG AGGGAACTCC TACATTCTTT 
CCACCAGAAG AGGAAGACTA TGATATGAAT GGGGAAGTCG AGGAATATGA TCAAAATAGC 
AGCGATAACA AGGTAGACCT TCAAAAAATT ATCGAAATTC AAAATAGTAA AATTAAGAAC 
TTGGAAGAGC AACTAGGCAA TTATTACTCT GAACAGAGGG TTATATTTTC CAATCTCAGT 
GATTTCATCG AGCGTCAAAA TGAAGTATTT CAGCGCCAGA GTGAATACAT GCAAAAGATC 
CAAAATTCTA CAAATGGTCT TCTTGTTCTC TTATCTACGA GGAACAAGAA TATGATCCCT 
CTAGTTCAAC AAAGTCTATC AGAAACTAGT GAATTTATTT CGTCCATCAA CAACACAAAT 
ATTAAACAAG GATTGAATAA CAGCATTGAA TTACTTGCAA AATTGAATAG CAACACACAC 
AGCCAACAGC AACACATAGT TTCCATCACA AACAACACAC AATCGATAAT CAACCAAAGT 
ATAGTACAAC CACCCAGCGA GCGGCCAAGC AGCACTCCTT TCCAGCCACC ACCATTAACT 
CCAAAACAAA TAGAACGTCA AACAGTTTTG AGGAGGCGTT TGTCCAGACA GGCTACTACC 
TTATTTGAAA TGTGGGACGA TTTTAAGGGT TTGGAACAAG AGTTGAAAGA CCATGAAATT 
ACCGTGACAG AATGGTTAAA GGTTCATGGA AGTTCTGAAA GACAATTTAG ACACACTCGG 
TTAAAGATTA TCAAGTTTAT TGAGGATGAG GCAGCAAGAA GGAATTGCCC AGTTGAATTT 
GTCAAGGAAA AACTCCATAC AAAGATGAGA AATAGAGTGA GACCTTGGAC TTTAGACGAA 
GTACAGAGAA TGCTTACTTC AGGTAAGAGA ATTGATTTGG ACGACTAG

Protein sequence

MSDSEDSSID INEYSIRDYY KLLRPLWAAK NINASYLNNH KLLRTLVDFS LTHSLYLKNL 
QKRELELGDI IPTKINYVDA LVIKTPNNNS LNNTEHAYQY YGCFRNKFVE FCPHLAIAVY 
LFSRFHIPDE YGSLEFMVSD YKNKLSLEDV KLLKGNNKLS AISYSQQHKS SINALSLSGL 
NYKDINLNKL LVTQTLDIQE KLVSLDIDHL PHSVMLSLAG FESFTDYNIA RNSVEPPQEL 
LEQIFPFINK PNPEESLAMT RIRQLLMMLR RTLCQDMVII KKKYPSNPVS RNPIFSSELF 
TNFCNEEYDQ NSSDNKVDLQ KIIEIQNSKI KNLEEQLGNY YSEQRVIFSN LSDFIERQNE 
VFQRQSEYMQ KIQNSTNGLL VLLSTRNKNM IPLVQQSLSE TSEFISSINN TNIKQGLNNS 
IELLAKLNSN THSQQQHIVS ITNNTQSIIN QSIVQPPSER PSSTPFQPPP LTPKQIERQT 
VLRRRLSRQA TTLFEMWDDF KGLEQELKDH EITVTEWLKV HGSSERQFRH TRLKIIKFIE 
DEAARRNCPV EFVKEKLHTK MRNRVRPWTL DEVQRMLTSG KRIDLDD