Gene PICST_30020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_30020
Symbol
ID	4836831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	1748662
End bp	1749876
Gene Length	1215 bp
Protein Length	404 aa
Translation table	12
GC content	38%
IMG OID	640388146
Product	predicted protein
Protein accession	XP_001383104
Protein GI	150864332
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.201529
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.620116
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGAAG AAACATGCTA CGGCCAACTT TCATCGATGA TGTCAAAACA GCTCAAAGTA 
GTAGACAGTC GCATCAAATC AAGTACCAAG GAGTTGGATT GGAATTATCT TAAAAGAACT 
CCCCAATTTC TCAAACAGAG AATCAAATTT GGAAATGGCT CATATACATC TGATGAGGAA 
TTCAATTATT TAGAGAAGCA ATTTAAGGAA ACGGAAAAGA CACTTCAATC GGTAGAAAAG 
TATGTCAAGA TGTATTCCAA AAGTACCTTA ACATTGTTGG ATAGAAGTAC AGCGGTTGGC 
AAAGGTTATT CTCTTCTCTA TGATCCATAC GAAGATCTAG CGAAGAAGAC TGGTGAACAG 
TCCAATTCCC AAGTTTTCGA AGACCAATAC AGGAAATGGC AAAACGTGAA CAACTACATT 
GAAACAATAA ATATGTGCAA ATCTGAAATT GAGAATGAAA CCAAAACCCT TGCAGCTATG 
GTTGAGCTGA AAATCCAAGA AATATACTCA AATATAAACA ATATTCACAA GAAGATAAGA 
GTCAGGTCTT ATGCCTTGGT AGACTACGAC AAAGTCTACA ATAGTCATGA CAACTTGCTT 
TTAAAGCAAA AGTCTGGAGA GCTTACTGTT AAGCAGTCTC AGCAATTGTT CAGTTCAGAG 
AGAAAATTGG AAGAGAATAA GGTCAAGTTT GATGAGATTA ATGATCTCTT AAAAAAAGAA 
TTACCCTATT TCTTGAAGTT GGTGGAATTG ATTTTGACCC CTTTGCAGGA GTACGTCTAC 
TATGTCCAGC TCATGAACTA CTTTCAATTT TCAAGCAGAT GCAAATCGTA TGCCAATTTC 
ATCAATTTGG ATGTCAGAAT CATTTCGTCT CCCAATTTCG CAGATGAGCT TATGACTCAA 
AATTCCATTG ACAGTTTGGG AGCTTATGAC TCCATTAACC AACTCACTCT AATCAACTTT 
AGAGACCGGT ATCTTTCTGA TATTACTTTG GCTTTAGAAC CAGAGAACAG GAACCCCATT 
CTCAAGGAGA CCAACTCCTA CTACTACATG GCAAAATTTA ACTTTGAGGG ACAGCAGGAA 
GGTGATCTTT CATTCAAACA TGGTGATATT ATCACGGTGT TAACTAGGAA TGGAAACTGG 
TGGAAAGGGG AGTTGGATGG AGTAGTTGGA ATCTTTCCAA GGAACTACGT AGAAGAATAT 
TCGCCCAGGG ATTAG

Protein sequence

MSEETCYGQL SSMMSKQLKV VDSRIKSSTK ELDWNYLKRT PQFLKQRIKF GNGSYTSDEE 
FNYLEKQFKE TEKTLQSVEK YVKMYSKSTL TLLDRSTAVG KGYSLLYDPY EDLAKKTGEQ 
SNSQVFEDQY RKWQNVNNYI ETINMCKSEI ENETKTLAAM VESKIQEIYS NINNIHKKIR 
VRSYALVDYD KVYNSHDNLL LKQKSGELTV KQSQQLFSSE RKLEENKVKF DEINDLLKKE 
LPYFLKLVEL ILTPLQEYVY YVQLMNYFQF SSRCKSYANF INLDVRIISS PNFADELMTQ 
NSIDSLGAYD SINQLTLINF RDRYLSDITL ALEPENRNPI LKETNSYYYM AKFNFEGQQE 
GDLSFKHGDI ITVLTRNGNW WKGELDGVVG IFPRNYVEEY SPRD