Gene PICST_50233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_50233
Symbol
ID	4841063
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	+
Start bp	365493
End bp	366653
Gene Length	1161 bp
Protein Length	386 aa
Translation table	12
GC content	40%
IMG OID	640392378
Product	predicted protein
Protein accession	XP_001386463
Protein GI	150866761
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0652] Peptidyl-prolyl cis-trans isomerase (rotamase) - cyclophilin family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0164202
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTGG AACCAGTGAG ACCTCATGTC TATTTGGATA TCTCCATCGG TGCAAGGGAT 
GTTGGCCGTA TTGTAATCGA ATTATTCGAT GATTTAGCAC CCAAATCCAC TGAGAACTTC 
ATCAATTTAT GTGATGGGGT ATCTCTCGAT GGCGAGATAC TAGGATACAA GAATAATGTT 
TTTCATAGAG TGATCAAGAA CTTTGTCATC CAAGCAGGTG ATTTGAAGTA TGGGCAATTC 
TCTTCAGTTG ATGCCTATTA TCAAGAAGAT ATAGGGAAAG GTAACATATC CACTGTAGAT 
CCTCCCAACA TGATAGAGGG CGAAAACTTG TCGGAAGCCC TAGATGCACC ATTCAAGGTA 
TGCATGGCTA ACAGTGGAGA CAAAAATGCA AACGGCTCTC AATTCTTCAT AACTACTTAT 
CCCCTGCCGC ATCTTACTGG ACGTCACTCA GTCTTTGGAA GAGTGATACA TGGGAAATCT 
GTAGTCAGAG AAGTCGAAAG AGTTAACACA AATAAGGAGA ATATCCCTAA AAAGGAAGAG 
ATAGTATTGA TCAAGGATTG TGGAAAATGG GATGAAAGCA TGCCTGTTCC TATTTTCAAC 
GCCAGCTACG ACACCAGAGG TGGAGATATA TACGAAGAGT TTCCAGACGA CGACGAGCAT 
ATAGACAAGG AATCATCAGA ATCAGTATAT GAAGCTGCTT CCAGGATCAA AGAAAGTGGT 
ACCTTGCTAT TTAAAGCTGG AAAAAAACAA GAAGCTTTCT TAAAGTACAG AAAGTGCATG 
AGATACATTA TGGAATACAT TCCTGACCAG GATCAAGAGC CTGAATGGTA TGAAAAGTAC 
ATTGATTTGA AGAAGAAAGT CTACTTGAAC TTGTCTTTAG TATGTCTCCA GTTGAAGAAC 
TATGTGAAAG CAGTAGACTA TTCGTCGTAC TTATTGGAAA TGGACAATGC TTCCAGTCAA 
GAAAAGGCAA AGGCTCACTT CAGAAAGGGA TCAGGCTTAA TAGAGTTGAA GAAGAATAAT 
TTGGCACTTG TAGATCTAGA AGCAGCTAAC AAGTTAGTAC CTGATGACGC TGCTATCAAC 
AGAGAACTTA CCAGATGCCA AGATTTGATA GAACGCCAAA AAAAGGAAGA GAAAGCTAAA 
TACGCCAAGT TCTTCAAGTA G

Protein sequence

MKVEPVRPHV YLDISIGARD VGRIVIELFD DLAPKSTENF INLCDGVSLD GEILGYKNNV 
FHRVIKNFVI QAGDLKYGQF SSVDAYYQED IGKGNISTVD PPNMIEGENL SEALDAPFKV 
CMANSGDKNA NGSQFFITTY PSPHLTGRHS VFGRVIHGKS VVREVERVNT NKENIPKKEE 
IVLIKDCGKW DESMPVPIFN ASYDTRGGDI YEEFPDDDEH IDKESSESVY EAASRIKESG 
TLLFKAGKKQ EAFLKYRKCM RYIMEYIPDQ DQEPEWYEKY IDLKKKVYLN LSLVCLQLKN 
YVKAVDYSSY LLEMDNASSQ EKAKAHFRKG SGLIELKKNN LALVDLEAAN KLVPDDAAIN 
RELTRCQDLI ERQKKEEKAK YAKFFK