Gene PICST_38766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_38766
Symbol
ID	4850783
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	45009
End bp	46010
Gene Length	1002 bp
Protein Length	333 aa
Translation table
GC content	42%
IMG OID	640392491
Product	predicted protein
Protein accession	XP_001387663
Protein GI	126273521
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2313] Uncharacterized enzyme involved in pigment biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0468003
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTATTAG CTCACAGGAG ACTTTTGTCT TCTTCTCAAG CTCGTGGATC ATTTCATATA 
GACATTTCGG AGGAAATCAA ACATGCATTG AATAGTCTGA AGCCCGTTGT ATCCTTGGAA 
TCAACAATCA TAACCCATGG TTTGCCATTT CCCCAGAACT TCGAGATGGC TAAGCAAGTT 
GAAGAAGTTG TCAGAGACAA TGGAGCTATC CCAGCAACTT GCGCTTTCAT AGACGGAAAA 
CCTCGTGTGG GCTTGAGCGA ACTACTGTTA AAATATTTGG CGGAACAGGC TAATAAGGGT 
AAGGCAAATA AGGTTTCTCG AAGAGATATT GGCTATACCA TGGCCAAAGG TTACAATGGA 
GGAACCACGA TTGCTCTGAC AATGATTCTT TCCCATATGG CGGGAATCAA GGTGTTTGCT 
ACTGGTGGTT TAGGTGGTGT TCATAAGGGT GGCCAGAATT CATTTGATGT TTCGGCAGAT 
TTGACGGAAC TTGGTAGAAC ACCAGTTTCT GTGGTATGTT CTGGACCAAA GTCTATCTTG 
GATATTGGTT TGACGCTTGA GTTCTTGGAG ACTCAAGGAG TTTTTGTAGG AACATACAAC 
GACGATGGAA GGCTCGACGT TGAGGTACCT GGTTTCTACT GTCGTGAATC TGGCTATAGA 
TCGCCATATG ATTTTTCCAG CTTCGAAGAG GCTGCCTCCA TTATCCATAA TCACAACAAT 
ATCATGTCTC TTAATTCAGG GAACATATTC TGCATTCCTC CACCGAGAGA ATCGGCATTG 
TCGTCTTCTT TCATAAGCAA AGTGATCGAC CGTGCCAATC AAGAAGCGAT TGCTCAAAAT 
ATTTCGGGCA AGAATTTGAC TCCTTTCTTG TTATCAAAGA TTGCAGAAGA AACCAATGGC 
AAATCTGTTG AATGTAATAT TAAATTTGTA TTAAATAATG CTAGAGCAGC CACCCAGATT 
GCAACAAGCT TGAGTAAATT AGAGAACAAT GTGAGTATAT GA

Protein sequence

MLLAHRRLLS SSQARGSFHI DISEEIKHAL NSLKPVVSLE STIITHGLPF PQNFEMAKQV 
EEVVRDNGAI PATCAFIDGK PRVGLSELLL KYLAEQANKG KANKVSRRDI GYTMAKGYNG 
GTTIALTMIL SHMAGIKVFA TGGLGGVHKG GQNSFDVSAD LTELGRTPVS VVCSGPKSIL 
DIGLTLEFLE TQGVFVGTYN DDGRLDVEVP GFYCRESGYR SPYDFSSFEE AASIIHNHNN 
IMSLNSGNIF CIPPPRESAL SSSFISKVID RANQEAIAQN ISGKNLTPFL LSKIAEETNG 
KSVECNIKFV LNNARAATQI ATSLSKLENN VSI