Gene PICST_49260 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_49260
Symbol	MAS2
ID	4840693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009047
Strand	+
Start bp	678396
End bp	679886
Gene Length	1491 bp
Protein Length	496 aa
Translation table	12
GC content	45%
IMG OID	640392008
Product	Mitochondrial processing peptidase alpha subunit, mitochondrial precursor (Alpha-MPP)
Protein accession	XP_001386145
Protein GI	126139245
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0300879
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.382382
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCGTT CTAGCCTTGC AAGAAGAGCA TTTACTGCTG CCACCAAACC CAACATCGAA 
ACTTCCACTC TTTCGAATGG GCTTCGATTA GTTACAGACT CCACACCGGG CCATTTCAGC 
GCTCTTGGGG CCTATGTAGA TGCTGGATCG AGATTTGAAA ACCCTAATAA GCCCGGCTTG 
TCTCATATAT GTGACCGTTT GGCATGGAAG TCTACTGAAA AGTACTCAGG CATGGAGCTC 
ATAGAGAACC TTGCCAAGTT GGGTGGAAAC TACATGTGTT CCGCACAAAG AGAATCTGTC 
ATCTACCAGG CTTCTGTTTT CAACAAAGAT GTAGAAAAGA TGTTTGATTG TATTGCCCAA 
ACTGTGAGAG CTCCTCGTTT CACTGACCAG GAACTCTTTG AGACTCTTCA AACTGCAGAG 
TACGAAGTCA ACGAAGTTTC GCTAAAACAC GATATGTTTC TTCCGGAAGT TTTACATTCG 
GCTGCATACC AAAACAATAC CTTGGGATTG CCCTTGTTCT GTCCCCCAGA ACGGATCCCA 
GAAATCGGCA AATCTGACAT CATCAACTAC CACAACCAGT TCTTCCAGCC ACAGAACATC 
GTAGTGGCAA TGGTAGGTGT GCCTCATGAA CATGCTGTCA AGTTAGCTGA AAAACAATTT 
GGGGATTGGA AGCCGGCAAA GAGTTATAGG CCCGACTTCG GAACCGTCAA GTACACTGGT 
GGTGAAATAT CCTTGCCTTT CCAGCCTCCC ATCTACAGTA ATATGCCTGA ACTATACCAT 
ATGCAAATTG CGTTCGAGAC TACCGGTTTA CTCAGTGACG ACTTGTATGC GTTGGCAACT 
TTACAGAAGC TACTTGGAGG TGGTTCCTCA TTTTCTGCTG GTGGTCCAGG TAAGGGTATG 
TTTTCCAGAT TGTACACCAG AGTATTGAAC CAGTACGCAT ATGTAGAGAA CTGCATGAGT 
TTCAACCATT CGTACATTGA TTCTGGTCTC TTTGGTATAA CGATATCGTG TTCTCCAAAT 
GCTGGCCATG TGATGTCGCA GATCATCAGT TTTGAGTTGT CAAAATTGCT TGAAAAAGAT 
CCTGCCAAGG GCGGACTCAC AGAGAAAGAA GTCAAGAGAG CCAAGAACCA GCTTATCAGC 
TCCTTGTTGA TGAATATAGA GAGTAAGCTC GCCAGATTGG AAGACTTGGG CAGACAGATC 
CAATGCCAGA ACAAGATCAC CACCATCGAC GAGATGATCC AGAAGATCGA AAGCTTGTCT 
CTAGAAGACT TGAGAGTAGT AGCTGAAAAG GTACTTACTG GCAGTGTAAT AACTAAAGGC 
ATAAGTAGCG GACAACCTAC TGTAGTAATG CAAGGAGACA GAGCTTCATT TGGTGACGTT 
GAGTTCATTC TTCGTCACTA CGGTTTGGGG AAGTTTCAAG GTCCTCCATT GGAAGAACCT 
AGAGATTTCT CCAAGATAGA AAAGCCTCAT AGATTTGGTA AATGGTTCTA G

Protein sequence

MQRSSLARRA FTAATKPNIE TSTLSNGLRL VTDSTPGHFS ALGAYVDAGS RFENPNKPGL 
SHICDRLAWK STEKYSGMEL IENLAKLGGN YMCSAQRESV IYQASVFNKD VEKMFDCIAQ 
TVRAPRFTDQ ELFETLQTAE YEVNEVSLKH DMFLPEVLHS AAYQNNTLGL PLFCPPERIP 
EIGKSDIINY HNQFFQPQNI VVAMVGVPHE HAVKLAEKQF GDWKPAKSYR PDFGTVKYTG 
GEISLPFQPP IYSNMPELYH MQIAFETTGL LSDDLYALAT LQKLLGGGSS FSAGGPGKGM 
FSRLYTRVLN QYAYVENCMS FNHSYIDSGL FGITISCSPN AGHVMSQIIS FELSKLLEKD 
PAKGGLTEKE VKRAKNQLIS SLLMNIESKL ARLEDLGRQI QCQNKITTID EMIQKIESLS 
LEDLRVVAEK VLTGSVITKG ISSGQPTVVM QGDRASFGDV EFILRHYGLG KFQGPPLEEP 
RDFSKIEKPH RFGKWF