Gene PICST_65833 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_65833
Symbol	YOX1
ID	4839280
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	-
Start bp	1562693
End bp	1564198
Gene Length	1506 bp
Protein Length	440 aa
Translation table	12
GC content	45%
IMG OID	640390595
Product	homeobox- domain containing protein
Protein accession	XP_001385298
Protein GI	150865898
COG category	[K] Transcription
COG ID	[COG5576] Homeodomain-containing transcription factor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCTAC AGACACCAAA GAGGACAAGC ACCTTCCCTC CTACACCCTC TTCTTACGGT 
GCCAACAAGC CTAACTTGCC TCCATTGTCA TCGTTGTTGT CGTCGACTCC TTCCAGCAAG 
GACCCTGCCA TAACTTCGAC TCCATACATG CCAACAAAGT TGCCTTCCAT CGACTCCTTC 
AGCACTACGC CAACTTCCTC GAGATACTTC CAGTCGAATC AAAGACCATT TGGTTCCTAT 
GCCTCTTTTC CTACACCTCC AACCTCAAGA GGTTCGATAA CAGGAAACTA CTCTGTCGAC 
ACCAGCGAAG CCGACATCAG CATCACTGAC TTGAGAAGAA CTTCTTCTTT TGCTCCCCCT 
CCTTCCACCC ATCACATTCT TAAGAGCATC AACACGTCTG CACATTCTGC CCCAGCTACT 
GCGGCTGTCA CACCTGTCAG TGCATCTGCT TCTTTGCCTC CTCCACCTCC ACAACCTGTT 
ACGTCTTCGA ACGACTCCAA GTCATATGCA TTCATTTCTC ATTCTCCTGC CACTTTCCCT 
CTGCAAGAGC CATCCATTGA CAATGCTCCA TTGGCCAGAA GGAAGAGGAG AAGAACATCG 
CCCAACGAAT TGTCGATCTT GAACAAGGAG TTCCTTGTCG GCTCCACTCC TAACAAGATG 
AGAAGAATTG AGATTGCGGC CAAGGTCAAC ATGACAGAGA AGGCTGTGCA GATTTGGTTC 
CAGAATAAGA GACAGAGTTT GAGAAAGCAG CTGAACCATG AGAAAGAAGT CACGGAGTTG 
CCTCCTACTC CTGTGGCAAT GGTTCCTCAT CCTCCAATGC CTGCAATGGT TGTTGCAGTA 
CCAAATGCCC ATTCTATTCC ACAAAATACT ACACTTCCAC CTCTTACTAG AAATCCATCT 
GGATCTTATT TGCCAGCTCC ACTTACATCC AACCCTCCAT TAATTTCATC TACACCAACA 
AAACCATTGA TCAAGTCTCA TTCCTACGTT GGCTCTCCAT CTTTAACTAC ATCTTCTCCA 
ATCAAGCCAA GATCTAGTTC GATTCCCAAC TTTGGAAAGA TTCCTGAAGC ATCCAGCACA 
CCTTTTGTAT CCAAGATCAT AAATGCTCAA ACTACAGCTA CTTCGACTAC AACTACAAAT 
GTCGAAGACG ATTCCAACAC TTCCATGGAC GACTCCATGA TTGCACACTC TAATAAACGT 
CAAAAGTTGG TTCTTAATGA AACCAGGAAA AAGCAACCTT TGCAGCTCAA CTCTGGCAGT 
TCCAGCACCA TGACCTTCAA GTTGATTCCA AGCAGCACTA AGGTCAACCA GAAGCTCTCC 
AGTGTACAAA ATGAGGATAA GAAGTCTTCC ATTCAGAGCA TTTTGAACTC TACATCTACA 
TCTACTAGAA AGCCATTGGG CGAAATCAGC AGCAACAATT TGAACAGCAA GCCTATTATA 
AAAAATGACA AAAAGGACGC TGCTGCCGAA AATTTATTGA GCTTGAAGGC TGGCCTCTGG 
AAGTAA

Protein sequence

MYLQTPKRTS TFPPTPSSYG ANKPNLPPLS SLLSSTPSSK DPAITSTPYM PTKLPSIDSF 
STTPTSSRYF QTSSFAPPPS THHILKSINT SAHSAPATAA VTPVSASASL PPPPPQPVTS 
SNDSKSYAFI SHSPATFPSQ EPSIDNAPLA RRKRRRTSPN ELSILNKEFL VGSTPNKMRR 
IEIAAKVNMT EKAVQIWFQN KRQSLRKQSN HEKEVTELPP TPVAMVPHPP MPAMVVAVPN 
AHSIPQNTTL PPLTRNPSGS YLPAPLTSNP PLISSTPTKP LIKSSSIPNF GKIPEASSTP 
FVSKIINAQT TATSTTTTNV EDDSNTSMDD SMIAHSNKRQ KLVLNETRKK QPLQLNSGSS 
STMTFKLIPS STKVNQKLSS VQNEDKKSSI QSILNSTSTS TRKPLGEISS NNLNSKPIIK 
NDKKDAAAEN LLSLKAGLWK