Gene PICST_83020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_83020
Symbol
ID	4838335
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	+
Start bp	1281543
End bp	1283124
Gene Length	1582 bp
Protein Length	447 aa
Translation table	12
GC content	45%
IMG OID	640389650
Product	predicted protein
Protein accession	XP_001383530
Protein GI	126134011
COG category	[I] Lipid transport and metabolism
COG ID	[COG3425] 3-hydroxy-3-methylglutaryl CoA synthase
TIGRFAM ID	[TIGR01833] 3-hydroxy-3-methylglutaryl-CoA-synthase, eukaryotic clade

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.203181
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CACATCGGAT TTCAAATTCT ACACTCTTTT CTTCAGTGGC GATTTTGGTT GTCTTTTTGC 
TTCTTTTGCT TCACTTTCTT TAACAATTCA CATGTCTCCA CAGAATATCG GTATTAAGGC 
CATTGAGGTC TACATTCCAA CCCAGGCTGT CAGCCAGTCT GAGTTGGAGA AGTTCGACGG 
CATTCCTGCT GGCAAATACA CCATTGGCTT GGGCCAGACC AACATGGCCT TCGTCAACGA 
CAGAGAAGAC ATCTATTCGC TCTCACTTAC AGTCTTGTCC AAGTTGATTT CTAACTATAA 
GATCGACACC AACAACATCG GTCGTTTGGA AGTAGGCACT GAGACACTTT TGGACAAGTC 
CAAGTCTGTC AAGTCTGTGT TGATGCAATT ATTTCCAGGC AACAACGACA TCGAAGGTAT 
CGACACTGTT AATGCATGTT ATGGTGGTAC CGCTGCTGTG ATCAATGCCC TCAACTGGAT 
CGAATCATCC TCGTGGGATG GTAGAGACGC TATCGTCGTC GCTGGTGACA TTGCTATCTA 
CGATAAGGGT GCTGCCAGAC CCACTGGTGG TGTTGGTTCC GTGGCTCTTT TGATTGGTCC 
AGATGCTCCA ATTGTGTTTG AATCTACTCG TGGTTCATAC ATGGAACACG CCTACGACTT 
CTATAAGCCT GACTTCACTT CTGAATATCC CGTTGTTGAT GGCCACTTCT CTTTGGCTTG 
TTATGTCAAG GCTCTTGACC AATGTTATCG TGCCTACTCC AAGAAGGTCA CCAAGGATGC 
CACCAAGACC GTTGGACTCT ACAACCACTT CGATTACAAT GCTTTCCACG TTCCTACCTG 
CAAGTTGGTG TCCAAGTCGT ACGCCAGATT GTTGTACAAC GACTACATAG CAGACCCAAC 
CAAATTTGCT GAGACTATCG ATGAAGCTAC CAGAACTGCT CTCGACAGTT TGACCTACGA 
GCAGTCATTG GTCGACAAGA ACTTGGAAAA GGTATTTGTA GGCTTGACTA AGCAAGAAGC 
TAAATCCAGA TTGGAACCTG CTCTCACGGT ACCTACCAAC ACCGGTAACA TGTACACGGC 
CTCTGCCTGG GCCTCGTTGT CCTCGTTGCT TTACTTCGTT GGCTCTGAGA AATTGCAGGG 
CAAGAGAGTC GGAATCTTCT CCTACGGTTC CGGTTTGGCC TCTTCGTTGT TGTCTGTTGT 
GGTCAAGGGA GATATCTCTG CCATCACTAC TAACTTGAAC TTTGACTACA AGTTGGGCGA 
AGGAAGAAAG ATTGAATCCC CAGAACAGTA CATCGCTGCC ATTGCCTTGA GAGAAAAGGC 
TCACTTGCAA AAGTCCTTCA AACCTACTGG TTCCATCGAC AACTTGGCCA AGGGTACCTA 
CTACTTGGTT GAAGTTGACG ACAAGTTCAG AAGAAGTTAC GATGTTAAGA ACTAGATCTT 
CTGAACCGTT TCATAGTACT CATCATGGCA TCTGTTAAAT CTTGTACTAT ATATTTGCTA 
GCATATCGTT CCATCGTCTC GCTATTCTTT TACTTCGATA TATTCTACTT GTCCTTAGCT 
ATTTAATAAT AGAACAACTC AG

Protein sequence

MSPQNIGIKA IEVYIPTQAV SQSELEKFDG IPAGKYTIGL GQTNMAFVND REDIYSLSLT 
VLSKLISNYK IDTNNIGRLE VGTETLLDKS KSVKSVLMQL FPGNNDIEGI DTVNACYGGT 
AAVINALNWI ESSSWDGRDA IVVAGDIAIY DKGAARPTGG VGSVALLIGP DAPIVFESTR 
GSYMEHAYDF YKPDFTSEYP VVDGHFSLAC YVKALDQCYR AYSKKVTKDA TKTVGLYNHF 
DYNAFHVPTC KLVSKSYARL LYNDYIADPT KFAETIDEAT RTALDSLTYE QSLVDKNLEK 
VFVGLTKQEA KSRLEPALTV PTNTGNMYTA SAWASLSSLL YFVGSEKLQG KRVGIFSYGS 
GLASSLLSVV VKGDISAITT NLNFDYKLGE GRKIESPEQY IAAIALREKA HLQKSFKPTG 
SIDNLAKGTY YLVEVDDKFR RSYDVKN