Gene PICST_30500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_30500
Symbol
ID	4837816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	219272
End bp	220444
Gene Length	1173 bp
Protein Length	390 aa
Translation table	12
GC content	43%
IMG OID	640389131
Product	predicted protein
Protein accession	XP_001383672
Protein GI	150864723
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.363686
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTTCG ATTTGGAGAA AAAGATAACC ACTGCCCATA TACCTCGGGC CAGTGGTTCG 
ACTATTTTAG CCTCAGACAC CTTGAATGTC GTCTACAACA AGTACAAGTC AACGGCTGCA 
ATTCCTACAG ATGCCATCAG ATACAACTTG ATTTTCTCCC ATGGAACAGG AATGAACAAG 
TCGATCTGGC ACTATCACAT CAAAAGCTTG TTTGAGTGGT CGCAGAAGAG CAACGGAAAA 
ATCTACATCG ACTCCGTCAT TGCCATCGAT GCTGCTGGCC ATGGTGATTC AGGAGTTATC 
AACAGGAATA AGCTCGGCTG GATTTTCAGA TGGGACGAAG GAGGCAAAGA CATTATTGAA 
GTGGTCAGAA ACGAACACAG AACTACGGGG GATTTCCAAA ATAACTTCAA GTCAAGAAAC 
ATCCTCATTG GACATTCCAT GGGAGGCTTT CTGTCATTGT TGGCTGCTTT CTATGAGCCG 
GACTTGTTCG ATGCAACTGT GCCAATAGAA CCTGTCGTTT ATCTTGACTC CAGATCAACT 
CGTAAATTTT CTCAGAGATT TCTGATCATA GGCAAGATGA TCATCAATGA ATTCGACACG 
AAACAGGCAT TTGAAGATTT CTTCAAGGTG CACTCGTTTT ACAAGAACAT AGACCCCAAG 
GTAATGGACG ACTTCTTGAA TGATGAATTA TTGGAAGTGA TCGACCCTAA AACCAAAGAC 
GTCAAGTACC GCATCAAGTC AAGTTCTCAA GCCCAGATGG CAGGATATGT ATCTTCTGCT 
TTGGTGTTGC CTCTAGGCAT GGATATTTAC AAACACATCA GAGTCCCCAT TGCCCATGTC 
ATTGGTAAGA ACGCTAAATG GAACCCTCCC GAATCCACTG AATTTTTCAG AGGCAGTGTA 
AATCCAGATT TTTTAGCAGC TACATACGAT ATTGAAGGAG GTGAACATTT GGTCAATGCG 
GAAAAGCCAG ACGATTTACT CGAGGTTCTC AAAGATTTCA TCTTGAAGAG AAAAGTTGAG 
TTCAAAAGTA CTGCTGCGCA ACTTCCAGAG CAAAAAGCAG AGGGTTTGAG ACAAAAGGTA 
TTTGAATCTG AGATCCCCAA GTTGCTTAAT GGTGATTTAG GCACATTGTA CGGAATACAA 
CACACCGCCT TGGCCAAAGC TTCCAAGTTG TAA

Protein sequence

MSFDLEKKIT TAHIPRASGS TILASDTLNV VYNKYKSTAA IPTDAIRYNL IFSHGTGMNK 
SIWHYHIKSL FEWSQKSNGK IYIDSVIAID AAGHGDSGVI NRNKLGWIFR WDEGGKDIIE 
VVRNEHRTTG DFQNNFKSRN ILIGHSMGGF SSLLAAFYEP DLFDATVPIE PVVYLDSRST 
RKFSQRFSII GKMIINEFDT KQAFEDFFKV HSFYKNIDPK VMDDFLNDEL LEVIDPKTKD 
VKYRIKSSSQ AQMAGYVSSA LVLPLGMDIY KHIRVPIAHV IGKNAKWNPP ESTEFFRGSV 
NPDFLAATYD IEGGEHLVNA EKPDDLLEVL KDFILKRKVE FKSTAAQLPE QKAEGLRQKV 
FESEIPKLLN GDLGTLYGIQ HTALAKASKL