Gene PICST_68494 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_68494
Symbol	HAP3.2
ID	4840953
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	-
Start bp	540388
End bp	542183
Gene Length	1796 bp
Protein Length	116 aa
Translation table	12
GC content	38%
IMG OID	640392268
Product	Transcriptional activator HAP3 (UAS2 regulatory protein A)
Protein accession	XP_001386697
Protein GI	126140350
COG category	[B] Chromatin structure and dynamics
COG ID	[COG2036] Histones H3 and H4
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.342746
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0633704
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

AACAAAGTTG ACTTTGCATA TCAAGCTATA TTGAAACCAG AGTGTTTTCC AAGAAGTCTC 
GAATATCGTT ACTTTCACCT GTACAAATAT AAAAGTGAAA AACTGCTTTT GTTTTCAGTG 
AAAAATTGAA ATTTTGAGTT ATTTGAATTA TTTAAATGAA CTAAAAGGTA TATTTTTCAT 
TATATAACTC ACAGTACTTT TCATTCTATA GCAGCATTGA CTCATAAAGC TCATTCGGTT 
AACTACAGAG AATACAATTA TTCTAATATT TGCACAATAT ATTCAACTAC CTTTTCATCC 
TTGAAGTACT ATTTCACCTT TTCGAAAGAA ATCTTTGTGA ATCACATAAA TTAAGTAATA 
CGATTGTACT CATAGATTTT TCACAAGTTT TGTCTTCATT AAATCAATAT TCAATAGTCC 
TAAACCGAAT ATGGACCCTA ACAATTTAAA CCCACAAGAA GTGGAACTAA GAGAGCAGGA 
CAGATGGTTG CCCATCGCCA ATGTAGCTCG ACTCATGAAG AACACCTTGC CTACTACCGC 
CAAAGTATCC AAGGATGCCA AAGAGTGTAT GCAAGAATGT GTCTCTGAGT TCATTTCCTT 
CATAACCAGT GAAGCCAGCG ATAAGTGTTT GAGAGAAAAA CGAAAGACAA TTAATGGAGA 
AGATATCTTG TACTCGATGC ACGACTTGGG GTTTGAAAAC TACGCCGAAG TGTTGAAGAT 
CTACTTGGCC AAGTATCGTG AACAACAGGC TTTGAGGCAA GAAAGGGGAG AATCCAGAAC 
TTCTAAGAGG CAACAGAAAC AGGCTGCTGC TGCGGCCGCT GCTGCTGCTG CTGAGGCTGC 
GGCTTCCGAG GCTGCTTCTA CTGAAGACAT TGACGAGCTG GAGCACATGG AGTACCAAGA 
AGATGGCACT GGATCCAATT CTCCATCCCA GAATGGTGAT CTTAATGGTG AACACTATAT 
TGAAAATGAA GAGACATACC AAAACGGTCA TGAAGACCAA GAAAACGAAG AAGTTGAAGC 
TGTGGAAGAC GTGGTAGCTA CTGAAACCCA ACAACAGGAA CATAATGAAG TAGACTCCAA 
CTCAGTCACC CATGTAAATA GCGCTCTCGG CTCGAACTCT TCGTCAACTA GCTCGATAGC 
TTCACCAGAG CCTTACTTTA ACCATTACGA AAATAACGAA AACGAAAACG AAAACGAACA 
GGACAATTCC AAACCAGACC AACCAAACAC CGAAGAAACA GAACAGTCGG AACTAGACGT 
TGTTGTTCCC CTCAAAGAAG GAGAAGAGTA TGGATATGAC GACTTTATCA CCGATGAGCC 
ACATGATGAA CTCCACATCA GCGAAACCTC CAGTCATAAC CATATCGAGG AGTTGGCAAA 
ACAGCTTACC CATGACGAAC CAGATATTGA CACATTGACA GCTGGAATCA CGAATGGAAC 
CGCCAACAAT GGTTTTTTCT AGTCAATTCT GCAAATCTAG ACTATTCATA GAGGTGCTTC 
AAAAGTTACG GTTTATTCAT AGAAGTGAAC TTCATATTTA TTCCATTGTA CAAATAAGTT 
GTTGTATTTT GTTCTTTTTC TTTGGTGGAG GTGGATGAAA ATCTTGTATT TCAATTCTTT 
TTTGTGTTAA CTACTATACA TGTATTATGT TGCGGTGTTG TAGATATCAA AGGTATTGTA 
TTAAATTAGT TAAATGTGCA AACTTTACAC ATTAGTAGAA ATGAACCCAA TAAATAGTAC 
CGGAAAGACA AACTATGCTA TTATATTTTT TCTCTGCAAA TAGGGCAGCT TCTTGA

Protein sequence

MDPNNLNPQE VELREQDRWL PIANVARLMK NTLPTTAKVS KDAKECMQEC VSEFISFITS 
EASDKCLREK RKTINGEDIL YSMHDLGFEN YAEVLKIYLA KQTMLLYFFS ANRAAS