Gene PICST_66589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_66589
Symbol	CAP1
ID	4851665
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	2487570
End bp	2489833
Gene Length	2264 bp
Protein Length	492 aa
Translation table
GC content	43%
IMG OID	640393373
Product	transcriptional activator involved in oxidative stress response
Protein accession	XP_001387049
Protein GI	126275202
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CCTTAATCTA TAGCTATCCG GCCAATTGTT CTTCGGACAA GTAGTGCCGT TCTTTCAATT 
GTATATTCGA CACCTCCACT GCTGTGTTCG TGTCTCCATC CTAAGCTGTC TAGACGTTAT 
AACCGACGCG TTCACCCGTC TAAGCTCCGT CCCAGTCTCT CCATAAATCG TGTCCCAAAT 
ATTTGGCACC TGCAAGCATC CCTCCTGCAG ATAGATCCAC AGTCTCCAGA CTTTTTTCTG 
TAGCCTTCCA CAGATAAAAA GAAATTTGTA CCAGTATCGT ACGCAGGATC CAGAAGTTAC 
CCGCACGCCG TCTTTATTGA TTACTAATAT CTGTGCTAGA ATAGTGAAAT ATATCACTAG 
AGCATCTCCA AAAGCAGTTT TTCACACGTC TAGTTACTCG TGTTAGCTAC TTTTCGTGTT 
TCTATTTCAA CCAACAATCT TTGTAAACTC ACCAGCATGA ACGACGTGAA GAGAAATTAC 
GCTGAGGTTC TATCCTCAGA GTCGCCCATG GGGTCTACAC CAGACGCACA TGACGACAAG 
AAGTTACATA CCAAGCCTGG CAGAAAGCCG ATAGAGACAG AGCCGAAGTC CAAGAGAACG 
GCCCAAAACA GAGCTGCTCA GCGTGCTTAT AGAGAACGTA AGGAACGTAA AATGAAGGAC 
TTGGAAGACA AGGTTAAGTC GCTAGAAGAC GAAAACATCA AGGCTACAAC AGAAGCAGAC 
TTCTTGAAAG CTCAGGTGGA TATGTTAAAG AATGAGTTAG CCAGATACAG AGGCCACACA 
GATTTCTCGG ACTTGAATCT ACCTACTAAG GTAGGAAATT TGTCGAATCC AAACACATCC 
AAGTCTGGCA GCTACAATTT CAATTCGGCT TCATCCACAG CATCTTCGGC CAAATCTGCT 
AATTCTGTAC AACACACATC TACATCTTCG TCTTTAAATG ATAATTCTCC ACGTCAGTTC 
TCTGTGGACT TTCCATGGTC CAAGGATAAC TTGATGAGTC TCAAGAGCGG TACAAACGTA 
GCCAGCCTGG AGTATAATGC CAACCAGCAG GTTCCAGATT TGGTGAGCGG CTCTTCCTCA 
TCTACTTCGC CTTTAAATGA TAACCTCTTG GTTTCGCCAG ATTCGTCTGT ATCCTCAGCT 
TCTAATCCAA TTAACGTCAA CACAAACTTG GACTTCACAT CGTCTTTTGA CGAGCAGTTG 
GATCCATTCT GTGTCAAGTT GAATGAAGCA TGTGGAACGA AGCAGTGCCC AGTTCCTAAG 
ACTAAGAGAA ACGACTCGAG GGTCTCCCAG AGCTCGATAC CCAACCAGTT CAGCTCGCCA 
TTCTCTAACT TGGTAACACC AACTCCGCAG AACTTAAACG ACATTGACTA CTTGAGCGAT 
CCGTTCTTCA ACCAAGTGGG AGATCCATTC TCTCTAGACT TGTCCAACAA CCAATCAGCA 
TTATCAACCA ACACTTCCGT GGATTCCAGC AATAGCATAA ACAGCAACAG TACGGCTGTG 
CCAGTTCGCT CAAATAACAC CAGCATAGCC ACTCCATCGC ATAACAACGA AGATCCATTG 
TCGTTCCTTA ATGACAACAA TTTCGATGTG TCGTTGGCTT TTGGTGATCC AAACCCTAGG 
CATGGTAAAG ATGAATTGGA CCCTATAGCA TTGTTGACTA CTGAAGAGTC GATCTATGAT 
CCGTTGAAGG ATACTAGCGG AGTGAACGTG AACTTCAACT TCAACGACTT TGTCAAGAGC 
TCCTTGCCCT CTGAGACAAC CCCCAAGGAA AGAAACTATA CTTTGACTGA ACCTTCTATC 
AATGAAGAGG TTGCTGAAGA TGACGATGAT GATGCTGTGG TGCCGGCTCC TGAACAAACT 
ATTAGATGCA GTGAAATTTG GGACAGAATC ACTGCTCATC CAAAGTATAC TGAGATTGAT 
ATTGATGGTT TGTGTAACGA ATTGAAGAGT AAGGCTAAAT GCTCCGAAAA AGGCGTGGTG 
ATTAATGCTG CCGACGTGAA TCAATTGTTG GAACAAAGCG CGATGAAGAG GCGTTGAACA 
GTATATGTTA ATTATTAATG CCAATTCGAC ACGTTTAATG AGATTTTTTC AGTTCGGACC 
TAAGTGATAT GTCATGTACC ATATTTTCAG ACTTTTTGTC GCAGCTTGAT TTTTAGTTCA 
TGTTCGATAG CAGTGCTAGT AGACTTTTTT CATGGCACTT AATTTATTCA TATCCATATA 
TATGGTATTT ACCTAGAGTT ATAAAAATAT AAAAACATCA ACTG

Protein sequence

MNDVKRNYAE VLSSESPMGS TPDAHDDKKL HTKPGRKPIE TEPKSKRTAQ NRAAQRAYRE 
RKERKMKDLE DKVKSLEDEN IKATTEADFL KAQVDMLKNE LARYRGHTDF SDLNLPTKVG 
NLSNPNTSKS GSYNFNSASS TASSAKSANS VQHTSTSSSL NDNSPRQFSV DFPWSKDNLM 
SLKSGTNVAS LEYNANQQVP DLVSGSSSST SPLNDNLLVS PDSSVSSASN PINVNTNLDF 
TSSFDEQLDP FCVKLNEACG TKQCPVPKTK RNDSRVSQSS IPNQFSSPFS NLVTPTPQNL 
NDIDYLSDPF FNQVGDPFSL DFNTTPSHNN EDPLSFLNDN NFDVSLAFGD PNPRHGKDEL 
DPIALLTTEE SIYDPLKDTS GVNVNFNFND FVKSSLPSET TPKERNYTLT EPSINEEVAE 
DDDDDAVVPA PEQTIRCSEI WDRITAHPKY TEIDIDGLCN ELKSKAKCSE KGVVINAADV 
NQLLEQSAMK RR