Gene PICST_87861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_87861
Symbol	RDS2
ID	4837174
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	1340444
End bp	1342923
Gene Length	2480 bp
Protein Length	663 aa
Translation table	12
GC content	43%
IMG OID	640388489
Product	putative Fungal transcriptional regulatory protein
Protein accession	XP_001383022
Protein GI	150864271
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.328163
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CTAATATCTT GGAATTACCG TCAAGGCAGC GACCTACGAT GTACGCCACG AGTCATCAGG 
AACAGGATAT GAAGCCCGGC ATTGACCGGG ACAGTGCCGG CCATAGCAAT GTGAATTCTC 
ATGAATCTCG GGACAAGAGT GATATTGGTA ATAGCAACAA TAATAGAAAT ATTAATAGTG 
ATAGCAATAA CGACAACAAC AATAGCATTG GCAATAGTAA TAACAACAGC AACAATACCA 
ACGGTCATAG TAGTCATACT GCTAGTACTA CCACCAATAG CAACGACACT AATAGTAAAA 
TTATTCATGC TGGTAATAGT CTTAATACTA CCAACTCCAA TAACAGCGAT ACTTCTGGCA 
ACACCCATTC GGACTCACTT GCCTATGCAG CTGTAGATTT CAAGTCTGAC TCCATCAATA 
GTAACAGTGG CACCACAAAC AGCACGAACT ACAATCACAG TAATCCACAA TCTCATTCTC 
ATTCCAACAC TAATAACAAT AGCACTAATA ATAATCACCA TTCTACCACT CTTTCTACGA 
CTGCGCTGTC ATCGCCTGAG CCATCAGGAT CGTCTTCGTC GAAGAAACGT AAAAAGAAAG 
TAGAAATTGC CTGCGTCTAT TGTCGTAGGT CTCATATGAT CTGTGACGAT TCTAGGCCCT 
GTCAACGTTG TATCAAAAGA GGCATTGGTC ATTTGTGTTA CGACGAGCCT TCCAATTCTC 
GTCAACGTAA AAAGGCAGCT GCTCTCCGTA AATCCACTAG TGATAGCTCC GCTCCGATAT 
CGTTATCGAC AGAAAGAACT TCTTTTCCCA ACGTATCGTC GTCTCTGCCG ATTATACCTG 
TTCCCGTAAC CTTGGAACAA CAGCTTCAAA GCCAGCTTCA AGGTCCACTA GACAAAGATC 
TGCTTTCATC ACCAAATCCT GGCAGTGGTG GTATTACCAA TTCTGGAGTT GGATCTATTA 
ATAATACTAG TACGACTAGT AATTCCGGAC CTGGTTCAAA AGTTCCGCAG CCTCTTCCAG 
GTCCGCCTAT TCAATCTGTA AACAGCCAAC TTCAGCTTCA TAAACCGCAC ACGTCTCTCT 
CCAACTCAGT CTTGTCACAA ACATTACCGT ATAACCAGGA GCCTTTCTTC TATTCTGAGC 
ACGCTGGAAG TGAGTTCAGT TCTCTTAACG ATTTCCTTCT GATGATTGAC GATCCCGAGC 
TTGTGAATGG AGCTCTCAAT GACGATCCTA CTGCTGGAGA CCCCATGCTA GCATTCCAGA 
CTGCTGGCAA TTTCGACTCT ACTGGCGCTA ACACTGCTGC TGGTGGAGCC ACAGTCACAG 
CCAGCAACTC AGCAACTAAC CTCAACAATA TCCTCTCCTT TTCACCAAAC CCATCTTTGT 
TCCAAAGCAC ATTTCAGAAT GACACCCACC AACTCAACCA ACAACAACAA CAGCAGCAGC 
AGCAGCAGCA GCAACAACAA CAACAACAGC AGCAGCAACT AAATCAGCAG CTACAAGAGC 
AGCAACAACA GCACCAATTC AATAGCAGCA GTAGTAACCA GTTCTTAAAG CCTCTGCCTC 
TTGTTCCAAT CCAGTCTGGA CAGATGACAG TTCCATCCAG TGGAAGTAAT ACTAATGGAA 
ACCAGCTGGA GCACCAACCT GTGATATCAG ATTCTGCTAG AGACAAGTTC TTCTTGACAG 
CAGCTGATCC AACTACAGAA ATCTCGCCAG AAGAAAGATT AAAACAGGTT ATTAAAGCAA 
AGTTGGAAGC TGGTTTGCTA CAGCCCTACA ACTATGCAAA GGGTTATGCT CGATTACAGA 
GTTATATGGA CAACTACATG AACATCTCGA GCAGGCAAAG GATCTTAAAG CCGTTGTCTA 
TTTTCCGTCC AGCTTTCAGG GCCATTGCCA GAACTTTGAA GGATGTAGAT TTGGTACTTG 
TAGAAGAGAA CTTTGAGCGC ATGTTGTTAG ACTACGATCG TGTTTTCACA TCCATGGCTA 
TACCAGCATG TCTCTGGAGA CGTACAGGAG AAATATATCG TGGAAACAAA GAGTTTGCCT 
CGTTGGTTGG CGTTATGACG GACGATCTCA AAGACGGCAA GCTCGCAATC TACGAGTTGA 
TGAGTGAAGA AAGTGCCGTC AACTTCTGGG AGAAGTATGG TGCTATTGCC TTTGATAAGG 
GCCAGAAGGC AGTATTGACG AGTTGTAATT TGAGAACAAG AGACGGGATC AAAAGGAAAA 
GTTGTTGTTT TAGCTTCACC ATCAGACGTG ATCGCTACAA CATTCCCAGT TGCATAGTAG 
GAAACTTCAT TCCTATTGAC CCTTAATTGA ACAAATTTTA TTCCTTGTAT TATTTTCATT 
ATCGTTTTGA CTATCAATAT CATTACGGTG TTGATTTTCG TCATCATATC AGTATTGTTT 
TCCTATTTGT CGTGTCTATT GTTAGATTTA TGTCTTTCAA ATGACGTTGA TAGCATATTT 
ATTATAATTT ATTCTTCTTC

Protein sequence

MYATSHQEQD MKPGIDRDSA GHSNVNSHES RDKSDIGNSN NNRNINSDSN NDNNNSIGNS 
NNNSNNTNGH SSHTASTTTN SNDTNSKIIH AGNSLNTTNS NNSDTSGNTH SDSLAYAAVD 
FKSDSINSNS GTTNSTNYNH SNPQSHSHSN TNNNSTNNNH HSTTLSTTAS SSPEPSGSSS 
SKKRKKKVEI ACVYCRRSHM ICDDSRPCQR CIKRGIGHLC YDEPSNSRQR KKAAALRKST 
SDSSAPISLS TERTSFPNVS SSSPIIPVPL HKPHTSLSNS VLSQTLPYNQ EPFFYSEHAG 
SEFSSLNDFL SMIDDPELVN GALNDDPTAG DPMLAFQTAG NFDSTGANTA AGGATVTASN 
SATNLNNILS FSPNPSLFQS TFQNDTHQLN QQQQQQQQQQ QQQQQQQQQQ LNQQLQEQQQ 
QHQFNSSSSN HNTNGNQSEH QPVISDSARD KFFLTAADPT TEISPEERLK QVIKAKLEAG 
LLQPYNYAKG YARLQSYMDN YMNISSRQRI LKPLSIFRPA FRAIARTLKD VDLVLVEENF 
ERMLLDYDRV FTSMAIPACL WRRTGEIYRG NKEFASLVGV MTDDLKDGKL AIYELMSEES 
AVNFWEKYGA IAFDKGQKAV LTSCNLRTRD GIKRKSCCFS FTIRRDRYNI PSCIVGNFIP 
IDP