Gene PICST_36132 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_36132
Symbol
ID	4838432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	+
Start bp	1798927
End bp	1800177
Gene Length	1251 bp
Protein Length	416 aa
Translation table	12
GC content	39%
IMG OID	640389747
Product	predicted protein
Protein accession	XP_001384298
Protein GI	150865185
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2377] Predicted molecular chaperone distantly related to HSP70-fold metalloproteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGACTAA ATTCAGGCAC TTCAATTGAT GGCATTGATG TTGTTTTATG TAACTTCAAG 
CAAAGCTCTG TTGATTCACC TCTACACTTA TCTGTACTCA AATATGATGA AATGGATATG 
CCACCAGCTT TGAAGAGTAG AGTATTAAGA ATGATTAAAG AAAACAAGAC AAAACTCGAA 
GAGGTTTCAG AAATAGCTGC TCTCCTTGGA ATGGCCTTCG CAAAGGCTGC AGATGATTTT 
TGTCAGAAAC ACGGGATCGA GAAGAGCATC ATTGATATAA TAGGTTCGCA TGGTCAAACT 
ATCTGGTACG TACCTGATTC GAAGCCCGGC CAATGTCGGT CGGTAATTAC TCTGGGAGAA 
GCTTGCTATA TAGCAGAAAA GATGGGGAAA ACAGTTGTAT CTGAGTTTAG AATTTCGGAG 
CAAAGTGTAG GAAGACAGGG GGCACCAATG ATTGCATTCT TCGATAGTCT TCTCTTAGTT 
CATCCTAAAA AGTTTAGAAT ATGTCAGAAT ATTGGAGGAA TTGCAAATGT TTGCTTTGTT 
TTTCCTGAAA AGGATGGAGG TTTGGATAAG TGTTTTGACT ATGATACAGG ACCAGGTAAT 
GTCTTCATAG ATGCCGCTAT GAGATATTTT ACCAAAGGTA CTCTTGAATA TGATAGAGAT 
GGAAAGTGGG GGAAAAGGGG TGTTGTGCAC TTACCGCTAG TTGATGAATT CTTGACTGGT 
GAATACTTTT TAAGAGAGCC TCCAAAAACC ACGGGAAGGG AATTATTTGG TGATTCAGTT 
GCATTTGAAT TAATAGAAAA TATGATAGCC AAGGGTCTTA GCAAATATGA TATAATAGCC 
ACGTTGACAA GGATAACGGC TCAATCTATT GTCAACGAGT ACCACAAATA TTCTCTGGGG 
CATATTGACG AAATTTTCTT GTGCGGAGGA GGAGCTTTGA ATCCAAATAT TACAGAATAT 
ATTCAAAGCT CTTTTCCAGA CACCAAAATC AACCTTCTTG ATGTCACTGG AATTAGTGGA 
AGTGCAAAAG AATCAATCAC TTTTGCATTC CAGGGTCTTG AAGCTATTTT AGGAAGGTCA 
TTGATAATAC CTGATAGGGT TGATAGTCGA ACTCCGGTGG TGGTTGGTAA GGTAACCCCA 
GGTAAAAATT ACAGAGCATT GCAGAAGATG GCTGTTGAGT TTACTTCAAC TTGTAACTGT 
GATGGGTACT TACCATCTGT TAGAAAAATG GTAATAGATA GAAATGCATA G

Protein sequence

MGLNSGTSID GIDVVLCNFK QSSVDSPLHL SVLKYDEMDM PPALKSRVLR MIKENKTKLE 
EVSEIAALLG MAFAKAADDF CQKHGIEKSI IDIIGSHGQT IWYVPDSKPG QCRSVITSGE 
ACYIAEKMGK TVVSEFRISE QSVGRQGAPM IAFFDSLLLV HPKKFRICQN IGGIANVCFV 
FPEKDGGLDK CFDYDTGPGN VFIDAAMRYF TKGTLEYDRD GKWGKRGVVH LPLVDEFLTG 
EYFLREPPKT TGRELFGDSV AFELIENMIA KGLSKYDIIA TLTRITAQSI VNEYHKYSSG 
HIDEIFLCGG GALNPNITEY IQSSFPDTKI NLLDVTGISG SAKESITFAF QGLEAILGRS 
LIIPDRVDSR TPVVVGKVTP GKNYRALQKM AVEFTSTCNC DGYLPSVRKM VIDRNA