Gene PICST_31820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31820
Symbol	MET1
ID	4838944
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	1759339
End bp	1761063
Gene Length	1725 bp
Protein Length	574 aa
Translation table	12
GC content	43%
IMG OID	640390259
Product	methionine metabolism
Protein accession	XP_001384647
Protein GI	126136246
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0007] Uroporphyrinogen-III methylase
TIGRFAM ID	[TIGR01469] uroporphyrin-III C-methyltransferase [TIGR01470] siroheme synthase, N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.164559
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAACA TTCTAGCCTC CTTAAACTGT AGAGATGAAC ACCATCTCAT CATAGGAGTT 
TCCAACGTTG CTACACTCCG GATAAATTCC ATCTTGGATG CAGGTGCCAT TCCTATACTT 
TTCACTGAAT CTGGGGAAGT GTCTAAGGTA GAAGAGAGTG AAAAATTGAA GACAATAACC 
GGAAAGTTCG AGTTTGACAC TATAAGGCAA TTACTTATAT CTGAGGGGAG AGCCGAAGTT 
GACTTTATTG TCGATAGGGT ATTTGTGGCG TTACCGATGT CTCAAGCTAG ATTGAAGAAG 
AGCATATATG ACTACTGTAA GAAGAACAGA ATACCGATCA ACACTTCTGA TTCGCCTGAT 
CTCTCTACCT TCACGTTGTT GTCAACATTT ACTTCGGGAG ACTTCCAAAT GGGTGTTACC 
ACTTCTGGCA AGGGGTGCAA ATTAGCATCG AGAATCAAGA GAGAGTTGAC CAATGCCCTT 
CCAGCAAATA TAGGTGATAT TTGCGACAAG ATCGGCGACT TGAGAAAAAA GATACAAGAA 
GAAGATAATC TCGAGCTTGA AGACTTGAAA AACAGCGATC ATTTCCATTC CATTGGAGAG 
CACGACGAGG ATGCCATCAA TACAAGCAAG TTGAATGCTT TAGTGGAGGA ATTCAATATG 
ACACAAGAAC AAAAAAAATT GCAAAGAACG AGATGGTTGA GCCAAGTCGT CGAATACTTC 
CCGTTGAACA CGTTGGGGGA ACTATCGTTG GATGACTTGA CCTCAGCCTT CCATGAATAC 
AAAGCTGGCG CTGCCGAAAC AGATGAGCCA GAAAAGAAGA AACAAAAAGT CGTAGATTCC 
AAGAAGGGAA GCATATCCTT AGTGGGTTCT GGACCTGGGT CAGTTTCTCT TTTAACTATT 
GGAGCACTTC AAGCTATTCA TAATGCCGAT CTCATCCTTG CAGACAAATT AGTTCCACAA 
CAAGTGCTTG ACATCATTCC AAAGAAGAGA ACCAAATTGT TCATAGCCAG AAAGTTCCCT 
GGGAATGCTG AAAGGGCTCA ACAAGAATTG TTATCTATGG GTTTGGAAGC GTTATTGCGT 
GGACAAAAGG TGGTCAGATT GAAACAGGGT GATCCATATA TCTTTGGAAG AGGGGGAGAA 
GAGTACAATT ACTTCTCTGA AAGAGGATTT ACTCCAGTAG TGTTACCGGG AATCACTTCT 
GCCTTAGCAG CTCCTGTATT GACTAATATT CCAGCTACCC ACAGAGACGT AGCCGATCAG 
GTTTTGATCT GTACAGGCAC CGGTCGTCGT GGAGCTCTTC CAAACTTGCC TGAATTTGTC 
AAGTCCAGGA CAACAGTCTT TTTAATGGCA TTACATAGAG TGGTTGATTT GATTCCCAAA 
TTGATAGAAA GAGACTGGGA CCCAAAATTG CCAGCAGCAA TTATAGAAAG AGCTTCGTGT 
CCGGACCAGC GAATAGTAAG AACGACTATT GAGAATGTAG CCAAAGCTGT TGAAGCCTGT 
GGATCCAGGC CCCCAGGATT GTTGGTTACC GGATATGCCT GTGATGTTAT CTTCAAGCAC 
AATAGTGAAA CATCCGAACC ATGGGTGATA GAAGAAGGAT GTGAAACTGC CAACAGCACT 
CATTTAGAGC CATTCTTGAA ACTTGTTTCC TCCTATAATC CAGAAGACAT CTCCAAACCC 
AGCATTCATC AGACTCCCCC ACCTGAGCCA TTAGCTACTA GTTAA

Protein sequence

MTNILASLNC RDEHHLIIGV SNVATLRINS ILDAGAIPIL FTESGEVSKV EESEKLKTIT 
GKFEFDTIRQ LLISEGRAEV DFIVDRVFVA LPMSQARLKK SIYDYCKKNR IPINTSDSPD 
LSTFTLLSTF TSGDFQMGVT TSGKGCKLAS RIKRELTNAL PANIGDICDK IGDLRKKIQE 
EDNLELEDLK NSDHFHSIGE HDEDAINTSK LNALVEEFNM TQEQKKLQRT RWLSQVVEYF 
PLNTLGELSL DDLTSAFHEY KAGAAETDEP EKKKQKVVDS KKGSISLVGS GPGSVSLLTI 
GALQAIHNAD LILADKLVPQ QVLDIIPKKR TKLFIARKFP GNAERAQQEL LSMGLEALLR 
GQKVVRLKQG DPYIFGRGGE EYNYFSERGF TPVVLPGITS ALAAPVLTNI PATHRDVADQ 
VLICTGTGRR GALPNLPEFV KSRTTVFLMA LHRVVDLIPK LIERDWDPKL PAAIIERASC 
PDQRIVRTTI ENVAKAVEAC GSRPPGLLVT GYACDVIFKH NSETSEPWVI EEGCETANST 
HLEPFLKLVS SYNPEDISKP SIHQTPPPEP LATS