Gene PICST_40135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_40135
Symbol
ID	4851716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	2638823
End bp	2640295
Gene Length	1473 bp
Protein Length	490 aa
Translation table
GC content	42%
IMG OID	640393424
Product	predicted protein
Protein accession	XP_001387074
Protein GI	126275374
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.379103
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGAAG CTGCATATGA CAACGTCGAC TTCTCGGACG ATATTCGAGT CCAGGAGCTC 
CAATCCTGTA AAGCTATCTA CCCCAACTGC ACGATGAACT TCTCAAAATA TACTGGATCG 
ATAGAGATCC CACTCAAAAA CGAAGACGGC ATAATACTTC GACTATTACC CGAGTCCCAT 
CGAGATACTC CCTTATTAAC GCATAAGGTT TGCAATCTAC CTTCGCTTCT ATTCACTTTC 
GAACTTCCAG AAAGATATCC GTACGAAGAA TCACTTAACT TCAACCTTAC CAGTTCAATT 
TTGCACCAGA CTGTAGTAGA CTCTATGATA GTCCACTTGG AGCAAATCTG GGAAAGTTAC 
CAAGACCAGG TACTTTTCAG CATGATAGAC TATTTGCACG ACCAAACTCA GAACGAATGG 
GATCTGCTCA TTGGTCCCAA GTACGATGTT ACTAGTGGCC AAGAATTTCA GACCATAGTA 
GACTATGACA ACGACATTAA GCAACAGGAG TACGAAACTA AGACATTTAC CTGTGAGGTG 
TGCCAGGAAG ACTATAAAGG CGTTAATTGT CTGCGCTTCG ACTCATGTGG CCATACCTTT 
TGTAATACCT GTTTATTTGC CTACTTCTCG TCTGTGATCC GAACCGGAGA GATAGACAAA 
GTGCACTGCC CCAGTTATGA GTGCACCAAG AAGTTTGTCA AGACCAAAGA TGAATACTCC 
AAGTTGGAGT CGTGGCTTAT GTCAGATACT AGAGTTGAGG AAATTGTCAG GACTTTGCTC 
ACACCTGCTG TGCCGCTCAA TTTTCTCTCT AAGATATTGA CATCTGTCCA GAGTAATGAA 
AGTGGTGAGA AGACAAGTGA AGACTTGGTC AATAGATATT ATACGCTCTT CAAGAAGTCG 
CAGTACGAAT TCATTGGTAA ATTGCTACCT AACAGACTTG TAAAATGTCC TAGAATTGGC 
TGCGACGAAG CCATATTTAG AGAAGATCTC ACAGAGCGGT TGGTAGTATG TCCCAGATGT 
GCATATGCCT TTTGCAACGA CTGTCACAAC TCTTACCATG CCCGATTCAA AGTATGTAAA 
AAGGTCACTT CCGAGAGTGG CGATTATCTA GGGGTGGAAG TAAAGGATAT TGAGGCATAT 
ATGTCTTTAC CTAGAGACTC CTACGAGAGG AAGACTCTAA ATGCTCGTTA TGGCAGACAG 
CGTATCATTC GAGCAGTAGA AGAGTACCAG ATGGACCTTC TTTTCAACAA GATGTTGAAA 
GAAAGCAACG AAGTCAAGGA GTGCCCTGGC TGTGGAATCA TCATAGAGAA GTCTGATGGC 
TGTAACAAAG TCAAATGTTC GCAATGTGGC ACCAATATGT GTTTCTTATG TGGAGAGATG 
CTTGAGAATA ACTATGATCA TTTTGTTTCT GAAGACTCCT CTTGTTATAG GAAGTTATTT 
TTTGGAATGC CAGGTGCAGA GGAAGAATCA TGA

Protein sequence

MTEAAYDNVD FSDDIRVQEL QSCKAIYPNC TMNFSKYTGS IEIPLKNEDG IILRLLPESH 
RDTPLLTHKV CNLPSLLFTF ELPERYPYEE SLNFNLTSSI LHQTVVDSMI VHLEQIWESY 
QDQVLFSMID YLHDQTQNEW DLLIGPKYDV TSGQEFQTIV DYDNDIKQQE YETKTFTCEV 
CQEDYKGVNC LRFDSCGHTF CNTCLFAYFS SVIRTGEIDK VHCPSYECTK KFVKTKDEYS 
KLESWLMSDT RVEEIVRTLL TPAVPLNFLS KILTSVQSNE SGEKTSEDLV NRYYTLFKKS 
QYEFIGKLLP NRLVKCPRIG CDEAIFREDL TERLVVCPRC AYAFCNDCHN SYHARFKVCK 
KVTSESGDYL GVEVKDIEAY MSLPRDSYER KTLNARYGRQ RIIRAVEEYQ MDLLFNKMLK 
ESNEVKECPG CGIIIEKSDG CNKVKCSQCG TNMCFLCGEM LENNYDHFVS EDSSCYRKLF 
FGMPGAEEES