Gene PICST_90814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_90814
Symbol	MLS1.2
ID	4840685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009047
Strand	-
Start bp	444915
End bp	446612
Gene Length	1698 bp
Protein Length	565 aa
Translation table	12
GC content	46%
IMG OID	640392000
Product	Malate synthase 1, glyoxysomal (MAS) (DAL7)
Protein accession	XP_001386287
Protein GI	150866625
COG category	[C] Energy production and conversion
COG ID	[COG2225] Malate synthase
TIGRFAM ID	[TIGR01344] malate synthase A

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0778949
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.869225
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTATCC AGGCCCAACC ACTCTTCAGC TCGCTTGCTG GTGTCCAGGT ATTGGCTCCA 
GTCTCCAAGA CTCCAGAATA TGAGCCCTCT ACCACTACCC AGGCAGACAT TTTGACCAAA 
TCAGCCTTGT CTTTTGTAGT TCTTCTTCAC CGTTCTTTCA ATTCCACTAG GAAACAGCTC 
TTGGAAAACA GACAACTTGT TCAGGAACAA CTTGACCAGG GCATTCCACT TCTGTTTCTC 
CAGGACGAAA CCATGACAAA GGTCAGAAAT GACCCAACCT GGCAGGGAGC CTTTCCTGCT 
CCAGGTTTGA CCGATAGAAG AACAGAAATC ACCGGTCCTC CGGAGCGTAA GATGATAGTC 
AATGCTCTCA ACACACCTGT CAAGACCTAC ATGAGTGACT TCGAAGACTC ATCTGCTCCT 
ACTTGGGCCA ATGTCATCAC TGGCCAAGTC AACTTGTACG ATGCTGTCAG ACACCAGATT 
GACTTCGTTA GTAAGGACAA TGGTAAAGCA TATAGAGTCA ACCAGTCCCA ACAGTTTCTG 
ACTCCCACAC TTCTTGTACG TCCCAGAGGC TGGCACATGG TTGATAAGCA CATCTTAGTA 
GATGGAGAGC CTGTGAGTGC CTCGATTTTG GATTTTGGCT TATACTTCTT CCATAATGCT 
CACGAGCTCA TCAACCAGGG TAGGGGTCCA TACTTCTACT TGCCGAAGAT GGAGCACCAT 
TTGGAAGCTA AGCTCTGGAA CGACGTCTTC AACGTAGCCC AGGACTCATT GGCCGTTTCT 
AGGGGTACCA TCAGAGCTAC CGTTCTCATT GAAACATTAC CTGCTGCCTA TCAGATGGAA 
GAAATCATTT TCCAATTGAG AAACCATTCG GCAGGATTGA ACTGTGGAAG ATGGGACTAC 
ATATTTTCAA CTATCAAGAG ATTACGTAAC GACCCCTCTA AAATCTTACC CGACAGAGAC 
CAGGTTACAA TGACGGTTCC TTTTATGAAA GCCTACTGTG AGCGTTTGAT AAACATCTGC 
CACCGTAGAC AAGTCCATGC TATGGGAGGC ATGGCAGCTC AGATCCCTAT AAAGAATGAT 
CCTGAAGCCA ACAAAGTTGC TATTTCCAAA GTCAAAAATG ATAAGCTCAG AGAAGCTACA 
ATGAATTACG ACGGAACTTG GGTGGCTCAT CCTGCTTTGG CACCAATTGC CAACGACGTC 
TTCAACGAGC ATATGCCCAC TCCTAACCAG ATCCACATTG TTCCCGATGA AGATGTCTCG 
GAAGCCGATT TGTCCAACAC AGCCATTGCT GGAGGCAAGA TCACAACCGA GGGTATTCGT 
AAGAATCTCT TCATTGCCCT AAGCTACATT GAATCGTGGC TCAGAGGTGT GGGATGTGTT 
CCTATTAACA ACTTAATGGA AGACGCTGCT ACAGCTGAAG TGTCTCGTTT GCAATTATAT 
TCGTGGGTGT TGCACCTGGT AAAGATGGAA GACTCTAACA AGACTGTGAC CCCCGACTTA 
ATGAGCCTGA TATTAGAGGA AGAAGTCGAA AAACTCACTG AACAATTTGG CTCTAAGGGC 
CGCAAGTTTA AAGAGGCAGC CAGATACCTT GAGCCAGAAA TCACTGGCAA GTCTGTGTCG 
GAGTTCTTAA CAACCTTGAT CTATGACTCT GTAGTTACTG TTGGCAAGCC AATCGACTTG 
GAAGCCTTGA AGGACTAG

Protein sequence

MTIQAQPLFS SLAGVQVLAP VSKTPEYEPS TTTQADILTK SALSFVVLLH RSFNSTRKQL 
LENRQLVQEQ LDQGIPLSFL QDETMTKVRN DPTWQGAFPA PGLTDRRTEI TGPPERKMIV 
NALNTPVKTY MSDFEDSSAP TWANVITGQV NLYDAVRHQI DFVSKDNGKA YRVNQSQQFS 
TPTLLVRPRG WHMVDKHILV DGEPVSASIL DFGLYFFHNA HELINQGRGP YFYLPKMEHH 
LEAKLWNDVF NVAQDSLAVS RGTIRATVLI ETLPAAYQME EIIFQLRNHS AGLNCGRWDY 
IFSTIKRLRN DPSKILPDRD QVTMTVPFMK AYCERLINIC HRRQVHAMGG MAAQIPIKND 
PEANKVAISK VKNDKLREAT MNYDGTWVAH PALAPIANDV FNEHMPTPNQ IHIVPDEDVS 
EADLSNTAIA GGKITTEGIR KNLFIALSYI ESWLRGVGCV PINNLMEDAA TAEVSRLQLY 
SWVLHSVKME DSNKTVTPDL MSSILEEEVE KLTEQFGSKG RKFKEAARYL EPEITGKSVS 
EFLTTLIYDS VVTVGKPIDL EALKD