Gene PICST_82779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_82779
Symbol	RAD23
ID	4838295
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	818254
End bp	819740
Gene Length	1487 bp
Protein Length	366 aa
Translation table	12
GC content	45%
IMG OID	640389610
Product	nucleotide excision repair protein (ubiquitin-like protein)
Protein accession	XP_001383791
Protein GI	150864814
COG category
COG ID
TIGRFAM ID	[TIGR00601] UV excision repair protein Rad23

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CCACCGTTGA ATTGACCCCG TGCACTGTTT TCGTAATGCA AGTGATTTTC AAGGATTTCA 
AGAAACAGAA AGTGCCCTTG GAGGTCGAGT TGACCGACAC TGTATGTATA TGAAAGATAG 
AGACTTACTG AAATTTTGCA GAGAGACGTG AATATTTCGT TGAGAGGAAC ACAATTTGGT 
TGGTTAGATT GAGGATTGGC TGATATAGGG ATTCAAATTA CTTATTAAAT GAATGGTTTT 
ATAAAGACTC ATAATTTGCT TCCAAATTTT ATCAAATATA AAATATCTAA CACCAACGCG 
ATTATATCAG CGCATTAAAT GAAAATCTTC ATTTGTTAAT TTATTTCAAC TTTCGGTAGT 
TGTCAATGTC AATAATAGTT GCTTTTACTA ACGCTCTTCA GGTGTTGGCG ACCAAGGAAA 
AACTCGCTGC CGAAAAGGAC TGCGAAGCCC CGCAATTAAA GTTCGTCTAC TCCGGTAAAG 
TGTTACTGGA CGAAAAGACT TTGGAGGAGT TTAAGATCAA GGAAGGCGAC TCGATCATTT 
TCATGATATC CAAGGCTAAA AAGACTCCTA CGCCTGCTCC TGCTGCTGCG CCAATTACGA 
CAACATCTTC CGAACAGTCA TCTGCCACCC CTGGATCTAC CACTGCCACC ACTACTACTG 
GTAATGCTGA GGGTTCTACC GACTCTGGTA TTTCTTCTGG AAATGCACCA GAACCAGAAG 
CAGCTGCACC AGAATCTTCT ACAACTTCGG AACCAAGTTC TACTTTTGCC CAAGGCTCAG 
AGCGCGAAGC TAGCATTCAG AACATTATGG AAATGGGATA TCAAAGAGCC GAAGTTGAAA 
ATGCATTGAG AGCAGCTTTC AACAATCCTC ATAGAGCCGT AGAGTATCTC TTGACTGGAA 
TTCCGCAATC TTTGCAACGT CCGGAAGTGC CAGCCGCCGT AGCTCCTGTA GCTGACTCAA 
CTCACGAAGA GTTGGCGCAG GATCACGACA TTGACGATGG CGAAGAACAG GGTGAAAACT 
TGTTTGAAGC TGCCGCAGCC GCCCAGGCCA GAAGCCAAGG GGCTGGTGCC GTAGAACAAC 
CGGCAACTGG TGGAGGATTA GCGGAAATGG GCGACGATGA ACAGATGAAC TTGTTGAGAG 
CATCGTTGCA ATCAAACCCC GAGTTGATCC AGCCTATTTT GGAACAATTG GCCCTGTCCA 
ATCCCCGAAT CGCTACTTTG ATTCAGCAAG ACCCAGAAGC GTTTATCAGA ACATTTTTGG 
GAGCTGGTGC CGACGAATTG GGATACGAAA TAGAAGGCGA TGACGGAGCT GAAGGAGCTG 
ACGCTACCGG CCAACAGCCA ATTCGTATTC CCTTGACAGA ACAAGACCAG AATGCAATTG 
AAAGATTGTG CGAGTTGGGC TTTGAACGTG ACTTGGTGAT CCAGGTTTAT TTGGCCTGCG 
ACAAGAACGA GGAAGTAGCT GCTGACATCT TATTTAGAGA TATGTAA

Protein sequence

MQVIFKDFKK QKVPLEVELT DTVLATKEKL AAEKDCEAPQ LKFVYSGKVL SDEKTLEEFK 
IKEGDSIIFM ISKAKKTPTP APAAAPITTT SSEQSSATPG STTATTTTGN AEAAPESSTT 
SEPSSTFAQG SEREASIQNI MEMGYQRAEV ENALRAAFNN PHRAVEYLLT GIPQSLQRPE 
VPAAVAPVAD STHEELAQDH DIDDGEEQGE NLFEAAAAAQ ARSQGAGAVE QPATGGGLAE 
MGDDEQMNLL RASLQSNPEL IQPILEQLAS SNPRIATLIQ QDPEAFIRTF LGAGADELGY 
EIEGDDGAEG ADATGQQPIR IPLTEQDQNA IERLCELGFE RDLVIQVYLA CDKNEEVAAD 
ILFRDM