Gene PICST_40760 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_40760
Symbol	HAT3
ID	4837331
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	+
Start bp	1608135
End bp	1609340
Gene Length	1206 bp
Protein Length	402 aa
Translation table	12
GC content	42%
IMG OID	640388646
Product	subunit of histone acetyltransferase
Protein accession	XP_001382533
Protein GI	150863899
COG category	[R] General function prediction only
COG ID	[COG2319] FOG: WD40 repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.500001
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.43958
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTATCA CACAGAAGGA TTTGGCTGTG GCCGAACGTG AAATCGTGGA AGAGCATCAG 
CTCAAAGAAA AAGTCGTCAA CGAAGAATTC AAGATCTGGA AAAAAACAGT TCCGCTTCTT 
TACGACACCA TACATACCTA TGTATTGGAC TATCCATCCT TGGCCATCAA GTGGCTTCCT 
GATTACACTT ATTCAGATAA CAAGAACTCT GTCAATGTCA AGTTTTTGAT AGGCACCAAT 
ACTTCACACA ATTCTCTGAA CTACTTGAAA TTGGGATCTG TAAACATTCC CAGTACATTG 
GCTCCCGATT TTTCCACTGT GAATCCAGAT GTTGACAGCA TTACCGTTCC CTCGCTGGTT 
ATCGAAGACA CTTCCGACTT CAGAATCTTG TCTAAATGGA AACAGACCTC GGAAATTAAC 
AAGCTCGACA TCTCTCCAAA TGGAAAGAAA GTATTGAGTT TCAACAGCGA TGGAGTTGTC 
CACTCCTACG ACTTGGAAAA CAACGACGTC ATCGACTACA AGTATCACAA GTCTGAGGGT 
TATGCACTTA CTTGGTTTGG AAATGATAGC TTCATCAGTG GTTCCAACGA TTCGCAGATT 
GCATTGTGGT CACTTGACAA ACCTTCTACT CCCATCCAGC TCTTCAAGAG CCACAATGGA 
GCCGTCAACG ACATCTCGTA TAATCCCAAC TTTGTCAGTA TATTTGGCTC TGTTTCGGAC 
GATTCATCAA CTCAATTCCA TGACTCTAGA GCTTCTGGTG ACAATCCTGT TATCAAGCAG 
GAAAACCAAC ATATTCAGAT GGCTATAAGT GTCCATCCTG AGATCGAAAC CTTGTACGCA 
ACTGGAGGAA AGGACAATGT GGTGTCGTTG TACGATATCA GAAACTACAA GATTCCTTTA 
CGTAAGTTTT TCGGCCACAA TGACAGTGTT GCTGGTATCA AGTGGGATGT AGAAGACCCC 
AGAACATTGA TATCGTGGAG TTTGGATAAG CGCATAATAA CGTGGGATTT GAAGGATTTG 
GAGGAGGAAT ATGCATATCC TGATGGAAAT GAAAACTCAA GAAGAAGAGC CGCTGTAAAA 
ATAGACCCTT GCTTGAGATT TATCCATGGA GGTCACACTA ATAGAGTCAA CGACTTTGAT 
GTACATCCCA AAATAAGGAG CTTATATGCA AGTGTAGGCG ATGACAATTT GTTGGAGGTC 
TGGAAA

Protein sequence

MTITQKDLAV AEREIVEEHQ LKEKVVNEEF KIWKKTVPLL YDTIHTYVLD YPSLAIKWLP 
DYTYSDNKNS VNVKFLIGTN TSHNSSNYLK LGSVNIPSTL APDFSTVNPD VDSITVPSSV 
IEDTSDFRIL SKWKQTSEIN KLDISPNGKK VLSFNSDGVV HSYDLENNDV IDYKYHKSEG 
YALTWFGNDS FISGSNDSQI ALWSLDKPST PIQLFKSHNG AVNDISYNPN FVSIFGSVSD 
DSSTQFHDSR ASGDNPVIKQ ENQHIQMAIS VHPEIETLYA TGGKDNVVSL YDIRNYKIPL 
RKFFGHNDSV AGIKWDVEDP RTLISWSLDK RIITWDLKDL EEEYAYPDGN ENSRRRAAVK 
IDPCLRFIHG GHTNRVNDFD VHPKIRSLYA SVGDDNLLEV WK