Gene PICST_33564 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33564
Symbol
ID	4840607
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009047
Strand	-
Start bp	970006
End bp	971231
Gene Length	1226 bp
Protein Length	408 aa
Translation table	12
GC content	40%
IMG OID	640391922
Product	predicted protein
Protein accession	XP_001386374
Protein GI	150866697
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACTCA AGAACTTATT CAGAAAGAAA GAACCATCCG AGCAGGAATT GAGAGATGAA 
CTTAGAGGGG CCGGAATCAT GACCAGCACC AGCGGAAGAA AGCAAGAGCA TTTTGGCCAG 
TTTAGATTCT CTAGCCAGAG AAATGATTCA AATCCATATT CTTCGATAAA CACTACTTCG 
TCCACGAAAC CATACACTCA AACCAGTTCC TTTTTCACTA ACACTACTCG AGGAAGTCTG 
TACACGTATG GAAGCGTTGA AAATAGCCGT ATTCCTACTA CTAGCAGAGA AGGATATACT 
CCCCCAGTAG CTAGGAGTAA TAGCGACCCA TATGGAATTG CCACAAGTTG GACCAGCCCA 
ACAGTTTCTC AGCAATCAGC CACGTATAGA GACCAACATA CTGTGGACCT CAACGAGCTT 
CCTACAGATA TGTCGAATCT TCGGAAGAAG AAAAAGTCTA CACGTCGTCC TCCAAAAGGT 
GACGACCCAG ATCTCAATTC TGTTTCTCGA AGAGTGGAAG TTGACTTGAA CGAAGATCCA 
AATGATGTTG AAGTACAAAC GGAAGAAACA ATGGATTTAG AAGAGAAGGA GATACGCTCA 
ACCAAAGAGG AGATTAAATT TGTGAGGAAG GAATCTCTCT TTTCTACTAA GACGACCTTG 
AATATGGCAA AACAAGCTGA CGATTCAGCA ACAAATACTA TGAAAATATT GGATTCACAA 
TCCGAAAAGT TATACAACAC CGAGCAGAAT TTGATGTTGG CAGATGTTCA GAATAAGATT 
GCTAACGAAA AGGCTAAAGA GCTCCATAGA TTGAACCGTT CCATATTCAT ACCCGCTTAT 
GGTTTCAACC AAAAGAAGAG CCTTGCGGAG CAGGAACAAA GAATTAAGAG CTTCAACGAA 
CAAGGTAAAC CTTCTCAGGA AGAAACCCCA AATAACATAA AGGGAAATTC AGACAGACTC 
AAGAATGATA TCAGTAGAAG TCTTTCATTC GAACATGGAA GAAGGAAACC TTTATCACCC 
AGATATCAAT TTGAAAATGA ATCTGAAGAT GACGAAATGG AACAGCAAAT CGAGGACAAT 
TTGGAGCAAA TTGATTACTT TTCTCGAAAA TTGAGCAAAT CTGCTTCAGT AATTGGACAA 
GAAATGGATT CCCAAAATGC TACATTGGAA GTCCTCGAAC AAAATGCTGA CATTGTTGAC 
TCCAATATAT TGAGAAATAC AGAAAA

Protein sequence

MALKNLFRKK EPSEQELRDE LRGAGIMTST SGRKQEHFGQ FRFSSQRNDS NPYSSINTTS 
STKPYTQTSS FFTNTTRGSS YTYGSVENSR IPTTSREGYT PPVARSNSDP YGIATSWTSP 
TVSQQSATYR DQHTVDLNEL PTDMSNLRKK KKSTRRPPKG DDPDLNSVSR RVEVDLNEDP 
NDVEVQTEET MDLEEKEIRS TKEEIKFVRK ESLFSTKTTL NMAKQADDSA TNTMKILDSQ 
SEKLYNTEQN LMLADVQNKI ANEKAKELHR LNRSIFIPAY GFNQKKSLAE QEQRIKSFNE 
QGKPSQEETP NNIKGNSDRL KNDISRSLSF EHGRRKPLSP RYQFENESED DEMEQQIEDN 
LEQIDYFSRK LSKSASVIGQ EMDSQNATLE VLEQNADIVD SNILRNTE