Gene PICST_83842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_83842
Symbol	PRW1
ID	4839288
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	-
Start bp	1606961
End bp	1608803
Gene Length	1843 bp
Protein Length	514 aa
Translation table	12
GC content	41%
IMG OID	640390603
Product	conerved hypothetical protein with WD repeats
Protein accession	XP_001385309
Protein GI	150865904
COG category	[R] General function prediction only
COG ID	[COG2319] FOG: WD40 repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAGA TTTCGGAGTT TGAAAGGCAG AGACAGGAAA ATATCCAGCG GAACAAGGAG 
CTCTTGAAGC TGTTGAATTT GGACTCTCTT TCTCAACTGA TTAAGAGAGA GCTTCCCAGA 
GCCAGCGAGA CCAAAAAAAG GAAAACAACT CCAAGAACAA AAGCTGTCAA AAAAGAGGAT 
GTCGAACCGT CAAGAAGATC ACGCCGGATT GCCGGAATCA AGTCGGAATT GGAAAACCCG 
GAAGAGTACA ACCGTATAAG AGAAGAAGAA GAGGAAACCG AGAGAAAGAA GCGTGAACTT 
GAAAAGTTGA AGAGAACTAG ATTGTTCGGA GAGTTCAGTC TTATTGATTT GGTCACAGAC 
AAAAAACTGG GGAGTTTGAA ATTTGAAGAT AAAGTCATCA AATCCGATTC GACTGAACCA 
GAAGTGAAGC AAGAAGAGAA AGAAGAACTA AGCGAAGACA TCAAAAACGA TAATAAAGTA 
CTCCATAGAT TGCAAGCTCT TGGAGACAAG TTTTCTGCTG GAGATTTCTT TGATATAATT 
CAAAAGAATC CCATCCAGTA CGACGATAAA GTATTACAGT CGACTCGGGA CGAGTTTGAT 
AAGTTGAAGA TCTACGAGAA ACACAATCCT CTCGATATCA AGATCTCACA CACCAGGATC 
ACAGCTATCA ATTTCCACCC TTCAACGACT GATAGAGTTG TGGCTGCTGG AGACACTAAT 
GGTAATGTGG GAATCTGGGC TGTAGACTCG GGTGAGGACG ATTCCGAGCC TACCATATCG 
ATTTTAAGAC CTCATGGTAA GGCTATATCT CGTATCTTGA CTCCTGTAGC TGAACAAAAT 
AAGCTATATT CGGCTTCATA TGACGGTTCT GTTAGAGTGT TGGATTTGAA CAAGTTGGCG 
TCGACAGAAG TGGTGTATCT TAATGATCCA TACGAAAACG ACGATTATGC CTTGGGAGTT 
TCCGATATCA ACTTCTGTGC CTCAGATGCC AATCTCTTAT ACATGACAAC ATTATCCGGA 
AGTTTCCATA AGCACGACAT TAGAACGCCA TTCAAACCTC TCAAAAGCAA AGATATACTT 
CGTTTGCATG ATAAGAAGAT CGGTTCTTTC TCTATCAATC CTAACAACAC CTATCAAATA 
GCCACAGCTT CGTTGGATAG AACCTTACGT ATATGGGACT TGAGAAACGT CTCGAAAGCC 
AATGCCGAAT GGTCAGAATT TGAAAACCAA ATCTCACCGC ATTTATATGG TTCATTCTCA 
TCAAGGCTCT CGGTGTCTTG TGTGGACTGG AATAGCGAAA ATCGACTCGT CTGCAATGGT 
TATGATGATT ATATCAACAT CTTTGATTTA AGTGGTTCAG AAGAATTGCC CGCAGTGACA 
GAATGGGAGT CAGACTTTCA GCCTAATGTA GCAAAGAAAT CCCGAAAGAG AAAGACCGAC 
GAAGACGAAG AATCGCTTAT TCCGGACAAT TTGAAAGCAT TCAACAAAAT CAAACACAAC 
TGTCAAACTG GTAGATGGGT GTCGATTCTT AAGTCCAAAT GGCAGGTTGC TCCAGAAGAC 
GGTGTGCAGA AGTTTGTCAT TGCCAATATG AACCGAGCTT TAGATATCTA TGATCAAAAG 
GGTCAGATAA TAGCCCACTT AACAGACTCT GTAGGAGCAG TTCCAGCAGT CTGTGGATTT 
CATCCTACAA AGAATTGGGT TGTAGGAGGA AGCGCTAGCG GAAAGGTGTA CCTATTTGAA 
TGACCTTTGA GGTTAACTTT GTTAGATGAA GGTAACCAGA CTGACAAGTC TACACAATCT 
CGCAACTACA GTAGAAACAA TTAATATACA CGTTTTTTAC TTG

Protein sequence

MAKISEFERQ RQENIQRNKE LLKSLNLDSL SQSIKRELPR ASETKKRKTT PRTKAVKKED 
VEPSRRSRRI AGIKSELENP EEYNHKKSGS LKFEDKVIKS DSTEPEVKQE EKEELSEDIK 
NDNKVLHRLQ ALGDKFSAGD FFDIIQKNPI QYDDKVLQST RDEFDKLKIY EKHNPLDIKI 
SHTRITAINF HPSTTDRVVA AGDTNGNVGI WAVDSGEDDS EPTISILRPH GKAISRILTP 
VAEQNKLYSA SYDGSVRVLD LNKLASTEVV YLNDPYENDD YALGVSDINF CASDANLLYM 
TTLSGSFHKH DIRTPFKPLK SKDILRLHDK KIGSFSINPN NTYQIATASL DRTLRIWDLR 
NVSKANAEWS EFENQISPHL YGSFSSRLSV SCVDWNSENR LVCNGYDDYI NIFDLNEESL 
IPDNLKAFNK IKHNCQTGRW VSILKSKWQV APEDGVQKFV IANMNRALDI YDQKGQIIAH 
LTDSVGAVPA VCGFHPTKNW VVGGSASGKV YLFE