Gene PICST_36688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_36688
Symbol	MAS1
ID	4840047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	-
Start bp	756785
End bp	758182
Gene Length	1398 bp
Protein Length	465 aa
Translation table	12
GC content	44%
IMG OID	640391362
Product	mitochondrial processing protease
Protein accession	XP_001385848
Protein GI	126138650
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0178117
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.476468
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGCTA GAGCATCACG TTTTAGTCGC TCTACTATTG CTGGACGTCG TTTGTTTACC 
ACAGCATCTC CTGTTCCAAC TTTCCAGACA TCAGTTCTTC CCAATGGTTT AACAGTAGCA 
AGTGAATCCA TGCCAGGAAC TAGAACCGCC ACCGTAGGCG TGTGGATCAA TGCTGGTTCG 
AGAGCCGACA ACCCTGCCAG TAGTGGCACT GCACATTTCT TGGAACATTT GGCTTTTAAG 
GGAACCAACA AGAGATCGCA GTTGAACTTA GAATTGGAAA TAGAGAACAT CGGCTCTCAA 
ATCAATGCTT ACACCTCAAG AGAGAACACA GTTTATTATA CAAAATGTTT GGAGACTGAT 
ATCAACCAGA ACATCGACAT TTTGAGCGAT TTATTGACGA AGTCAAAGTT AGAAGAAAGG 
GCCATCGAGA ATGAAAGACA TGTCATCTTG CAAGAAAGTG ACGAAGTCGA CAAGATGTAC 
GATGAAGTGG TGTTTGACCA TTTGCACGCA GTTGCTTTCA AGAGTCAAGA CTTGGGCAGA 
ACAATTTTGG GCCCCAGAGA GCTCATAAAG ACCATACAAC GAGATGATCT TGTAAACTAC 
ATCACTACTA ACTATAAGGG AGACAGAATG GCACTTATAG GTGTAGGCTG TGTCAACCAC 
GAGGACTTGG TCAAACAGGC ACAAAAGTAC TTTGGAGACA TCAAGAAGAG TGAAAAGCCC 
TTTAAACAAA GTGGAGGTGA TTTGCCAGTC TTCTATGGTG ATGAAATCAG AATCCAAGAC 
GATTCTTTGC CAACGACACA TGTTGCCTTA GCTGTAGAAG GTGTAAGCTG GTCAGCGCCA 
GACTTCTTTA CGGCATCTGT TGCCAACGGT ATAATAGGAA CGTGGGATAG ATCTATCGGT 
GTTGGATCCA ACTCTCCTTC CCCTCTAGCC GTAACAGCTG CTATTGGTGG CGCTGGAAAC 
ACCCCTATTG CCAACTCGTA CATGGCGTAC ACTACATCGT ATGCCGATAC CGGGTTGATG 
GGTGTGTATT TTACCGCCGA TAAAGATGCT AACTTGAAGT TGTTTATAGA TGCGGTTATG 
AAAGAATGGG CTAGATTGAA GTCTGGTGAC ATTACTGTGG AAGAAGTGGA GAGATCGAAG 
GCACAATTAA AGGCTTCCTT GGTTTTAGCA TTAGACGACT CTACGGCTAT AGCTGAAGAT 
ATTGGAAGAC AATTAGTCAA TACAGGATTC CGTTTGTCTC CTGAAGAGGT CTTTGAGAGA 
GTTGAGGCTA TCACTAAGAA GGACGTCATC GACTGGGCTA ATTACAGATT GAAGGATAAG 
CCCATAGCCT TATCTGCCGT AGGTAACGTC AAGACACTTC CTTCTCACCA ATATCTCACT 
AAGGGTATGT CCTTGTGA

Protein sequence

MLARASRFSR STIAGRRLFT TASPVPTFQT SVLPNGLTVA SESMPGTRTA TVGVWINAGS 
RADNPASSGT AHFLEHLAFK GTNKRSQLNL ELEIENIGSQ INAYTSRENT VYYTKCLETD 
INQNIDILSD LLTKSKLEER AIENERHVIL QESDEVDKMY DEVVFDHLHA VAFKSQDLGR 
TILGPRELIK TIQRDDLVNY ITTNYKGDRM ALIGVGCVNH EDLVKQAQKY FGDIKKSEKP 
FKQSGGDLPV FYGDEIRIQD DSLPTTHVAL AVEGVSWSAP DFFTASVANG IIGTWDRSIG 
VGSNSPSPLA VTAAIGGAGN TPIANSYMAY TTSYADTGLM GVYFTADKDA NLKLFIDAVM 
KEWARLKSGD ITVEEVERSK AQLKASLVLA LDDSTAIAED IGRQLVNTGF RLSPEEVFER 
VEAITKKDVI DWANYRLKDK PIALSAVGNV KTLPSHQYLT KGMSL