Gene PICST_31267 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31267
Symbol
ID	4838812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	+
Start bp	368804
End bp	369868
Gene Length	1065 bp
Protein Length	354 aa
Translation table	12
GC content	44%
IMG OID	640390127
Product	predicted protein
Protein accession	XP_001384025
Protein GI	150864987
COG category	[I] Lipid transport and metabolism
COG ID	[COG1946] Acyl-CoA thioesterase
TIGRFAM ID	[TIGR00189] acyl-CoA thioesterase II

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0263815
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.226493
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTACCT TAGAAGAGCT TCAGAGAAAC GTCTACGATA AGGACAACAT TTCCAAACTT 
GAAGCCAAGT TCGAGTTGAT TGAACAAACC AGCGATTCCC GAGTTTCAAT CTACAACGGT 
AGATACCCAT TACAGCCTTT CAGGGACGAC CAAAGAGGAG TATACGGAGG TGAGTTCGTG 
AGTCAGGGTG TCTTAGCTGC CTGGAAGACA TTGTCAGACC CCGAACTCAC TCCACATTCG 
TTACATGGCT ACTTCGTCAA AGCCGGGTCG AATAACTCTG TCGTCAGATG GGAAGTTGAA 
AATGTCAGTG ACGGAAGAAA CTTTGCTAAC CGTTTGCTCA GGGCATTTCA AACACATACA 
GATGTTTTAG TATTCACCCT TCAAGTGTCT TTTACCAAGA ATAACGACGG TGTCAAGAGA 
AGGGAGGTGT ATGAAGAACA GCTTGCTAAA GGTGTAGAAA ACATCAGGTC CATTCCATTT 
CTGTTTCAGA AGGTTCCCAA CCCTCTTTTC TACCAGTTCA AGGACAATAT TGATTCTTTG 
CCATCCATCG AACATACCCA TGAATTCATG ACTCATGCAT TTACTCCAGA TGCTTTCCGT 
CTGCCAAAAG TTTTGAACCA TGAAACTATC GGGAGCAGGC AATTAGGGTT ATTTGCCAAG 
ATCAACGAGG ACCCTTCTCT CGCTACAGAC AAGATCAAGA GCAAGTACAC TGCTGCACTC 
TATTTGAGTG ATTCCTTGTT TATCACCTTG GTTATGTCAG CAGTTGGTGT GGCCATATCT 
GAGGAAGAAA AGAATTTTTT CAGAGTGAGT CTTGACCACG CTGTGTATTT CCACGATCTG 
AATTTCGATG CGAGGGATTG GTTGTTCATC GACTTCAAGT TTCCATCCAT GGGCAACGAC 
AGAGCGTTGG TGTTGTGTAA CTTTTATACC TTGGATGGGC GTTTGGTTTT CAGTGTTAAC 
CAGGAGTTCT TGTGTTTCTT CCCCAAGAAG ATCATCGACA AGTCCAACTC ATTGCATGAG 
AAATATCTTG CTGCCCAGAA TAGCCAGGAG TCAGCCAAGT TGTAA

Protein sequence

MVTLEELQRN VYDKDNISKL EAKFELIEQT SDSRVSIYNG RYPLQPFRDD QRGVYGGEFV 
SQGVLAAWKT LSDPELTPHS LHGYFVKAGS NNSVVRWEVE NVSDGRNFAN RLLRAFQTHT 
DVLVFTLQVS FTKNNDGVKR REVYEEQLAK GVENIRSIPF SFQKVPNPLF YQFKDNIDSL 
PSIEHTHEFM THAFTPDAFR SPKVLNHETI GSRQLGLFAK INEDPSLATD KIKSKYTAAL 
YLSDSLFITL VMSAVGVAIS EEEKNFFRVS LDHAVYFHDS NFDARDWLFI DFKFPSMGND 
RALVLCNFYT LDGRLVFSVN QEFLCFFPKK IIDKSNSLHE KYLAAQNSQE SAKL