Gene PICST_66746 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_66746
Symbol	CSM1
ID	4852042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	3480360
End bp	3481714
Gene Length	1355 bp
Protein Length	333 aa
Translation table
GC content	40%
IMG OID	640393750
Product	CSM1-like protein
Protein accession	XP_001387000
Protein GI	126276407
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CATCTCCAGA ACATTGTGCA TACTACATCA AGAAATGGAA TTTCGAATCC AAATAAAGAA 
ATCCAATCCT TCGATAAAGG TTTGAGTTTT ATAGCACTGT ATTCGCAAAA GGGCTCGTTT 
AGTAAATCTT TGGTGTCATA CTGTTACACT GCAATAACGA TCTCCTTGTA ATTCCAATCT 
CACAATTGTA TTTTGAATTC GTTTTTCAAT CTTCACTTGT TGATCAACGC GTCCGATAAA 
TTCAACAACG AACAACATCC GTTTGATTTC ATGTTAGTGT AGTAATTCAG ATATTTCAAA 
TATGGCTCCC AAAACTCGTA AAACTGTCCA GAAAGTGAAA CCCGCTCCTG TGGAAGAAGT 
TCCCCACCCG AGAGTACGTA AGGTCTCAGC TAAGGTGTTG GAAAGTATGA CAGATGTATC 
AGCATCAACT CCCTCAATGA AGAAAAAGAA CCCCAGCTCA CCATCAACTT CAAAAAGATC 
ATCTTCATCT TCGTCAGCAG CAGTTTCGGC ATTAAGCAAG AAATTGAAGG CTTCCAACCC 
CATAATAACA GAGCAGGACA TTGTTTCTGC TGAAAACGGC CAGGAACTTA TAGAGCTCAT 
AAACGGACTA GTGAACACCA AACAGGACGA GACGTTCGCC AAATACAAAT CCAAGGTTCA 
GAACCAGCTA AATAATGACC ACCAAGTAAT ACAAGAGTTG AATGCCGATT TGCTCCAGCG 
CCAGGAAACC ATCAACGGCT TGCTCCAAGA GATAAAGCAG CTCAAGAACG AGGTTAGAAC 
ATATTCCTCA TCTAATTCGG CAAGTATGAC GGTCGACGGC TCTCTTGATG AAAGCAAGGA 
GTTTGTCTAT GAATCTCCCA TCAGAAAGAA GATCAACAAG AAAATCAAGA ACAGCGATAC 
ATTGATTAGC CAGGACCAAC TATCCAAAGA ACTAGAAAAT ATAGGTTTCA CTTTAGACAT 
GTTGGAACTT TTAACTGGTT TGAGAATTGT CAACTTCGAA GAAGATGAGT CCAAGTATTT 
CTTTGATGTA AAACAGTCTG GTTCGAATGG CCAAGATGAA ATCTACATCA ACTACCAACT 
TGTAATCTCA AAGTCGTTTG CAACTACTGC TGAGATCAAC TACATCCCTA CGTTCTTGGA 
AGCATTGGAA AATGATGACG AGGACCAGGA ACAGGTCGAT AACGCTAACC TCTTGAAGGA 
AATCCTTCCG GACTACTTGT GTGAGAACTT GTCGTTCCCC TACGATACCT TGTCACAGTT 
CTACAGTAAA GTCAACCGAG CGGTCAACAA GAGGACCAAA TGAGAGTATG TACAATAATT 
TCTCTATAAA TACACTAATG TACACCAGTT ATAGT

Protein sequence

MAPKTRKTVQ KVKPAPVEEV PHPRVRKVSA KVLESMTDVS ASTPSMKKKN PSSPSTSKRS 
SSSSSAAVSA LSKKLKASNP IITEQDIVSA ENGQELIELI NGLVNTKQDE TFAKYKSKVQ 
NQLNNDHQVI QELNADLLQR QETINGLLQE IKQLKNEVRT YSSSNSASMT VDGSLDESKE 
FVYESPIRKK INKKIKNSDT LISQDQLSKE LENIGFTLDM LELLTGLRIV NFEEDESKYF 
FDVKQSGSNG QDEIYINYQL VISKSFATTA EINYIPTFLE ALENDDEDQE QVDNANLLKE 
ILPDYLCENL SFPYDTLSQF YSKVNRAVNK RTK