Gene PICST_40742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_40742
Symbol	ERG12
ID	4837010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	+
Start bp	2272877
End bp	2274175
Gene Length	1299 bp
Protein Length	432 aa
Translation table	12
GC content	47%
IMG OID	640388325
Product	mevalonate kinase
Protein accession	XP_001382664
Protein GI	150863997
COG category	[I] Lipid transport and metabolism
COG ID	[COG1577] Mevalonate kinase
TIGRFAM ID	[TIGR00549] mevalonate kinase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0150941
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTACTC CATTCTTTGT CAGTGCTCCG GGCAAAGTCA TCATCTTTGG TGAACACTCA 
GCAGTATATG GGAAACCGGC CATCGCTGCT GCGCTCTCGC TAAGAGCATA TCTTCTAGTA 
ACACCTTCGC AGGACCCAGA CACCATCAAC CTCCTGTTCC CTGACATCAA CTTAACCCAT 
TCATGGAACA AAAACGACAT CCCCTGGGAC AGCATTGTCA AGCACATCAA CTTGGTCGAC 
AACTTGCCTC AGACATCTGA GGAACTCGTT CCCGAAATCG TAGATCAGCT TGGTCTGGTG 
TTGGCAGATT TGAACCTGTC GCTACACTAT ACAGCATGCT TGTGTTTTCT CTACTTGTAC 
ACCCATCTTT GCAACCAAGA ACTTGCAGGT ATGTCCTTCT GCATCCGTTC AACGTTGCCG 
ATTGGCGCAG GACTTGGCTC GTCGGCTCTG ACAGCTGTGT GTTTGGCATC TGCATTGGCC 
ATTTTGGGAA ATCGGGTTAC TTCAGCTTCG TTCTTGCAAA CTGACAAAAT CCTTAAAAAA 
GAGAACAACG ACTTGGACTT TATAGACAGC TGGTCCCTCA TGGGAGAAAA GTGTTTCCAC 
GGTAATCCTT CAGGAATTGA CAACGCTGTG GCTACCCATG GTGGTGCTGT GATGTTCCAG 
AGAATGAACA ACCCAGCCCA ACCCTCTGTT CGGACGTCAA TGAGAAACTT CCCTGCTATA 
AAGTTGCTTC TTACCAACAC TAAGGTTCCT CGTAGTACAG CGGATCTCGT AGGAGGTGTG 
GGAAAATTGA ATGTAGAATA CCCCAAAACG TCTAATTCCA TCTTGGAAGC AATGGAACAC 
TTGAGCAACA CTGCTTACCA AATTATGGTG AGACCATTTT TTGGTGCTGA AGAAAGGAAA 
AAGCTCCGAG AGTTGGTCAA CATCAACCAC GGCCTCTTGG TAGCATTGGG AGTATCGCAT 
CCTTCGTTGG AAAAGGTCAA AATCATTACT GACACGAGCA AGTTGGGCTC CACCAAGCTC 
ACAGGTGCTG GAGGAGGTGG ATGCGCCATC ACTCTTGTAG ATGAAGATGT TTCCGAGGCT 
GACATTGCTC AAGGAATTGC AGAGTTGGAA AAGGAAGGGT ACGAATGCTT TGAAACCTCG 
TTGGGTGGAA AGGGTGTAGG CTCATTGTCG TTTGAAGATG TTCCTCAAGA ATTGAGATCA 
ACTGTATTTT CTCCAGAAAA GTTCTGTGCT TATTCCGACC GCATAGAGAT AGAAAAGGTT 
TTAAGCACCA ATGCCCTTGA AGGATGGAGA TACTGGTGA

Protein sequence

MSTPFFVSAP GKVIIFGEHS AVYGKPAIAA ALSLRAYLLV TPSQDPDTIN LSFPDINLTH 
SWNKNDIPWD SIVKHINLVD NLPQTSEELV PEIVDQLGSV LADLNSSLHY TACLCFLYLY 
THLCNQELAG MSFCIRSTLP IGAGLGSSAS TAVCLASALA ILGNRVTSAS FLQTDKILKK 
ENNDLDFIDS WSLMGEKCFH GNPSGIDNAV ATHGGAVMFQ RMNNPAQPSV RTSMRNFPAI 
KLLLTNTKVP RSTADLVGGV GKLNVEYPKT SNSILEAMEH LSNTAYQIMV RPFFGAEERK 
KLRELVNINH GLLVALGVSH PSLEKVKIIT DTSKLGSTKL TGAGGGGCAI TLVDEDVSEA 
DIAQGIAELE KEGYECFETS LGGKGVGSLS FEDVPQELRS TVFSPEKFCA YSDRIEIEKV 
LSTNALEGWR YW