Gene PICST_41366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_41366
Symbol
ID	4836678
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	851569
End bp	852771
Gene Length	1203 bp
Protein Length	400 aa
Translation table	12
GC content	42%
IMG OID	640387993
Product	predicted protein
Protein accession	XP_001382936
Protein GI	150864204
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.122227
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.125571
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAAGT ACCACGACCT TCCGGATATC GACACCAACG CCCCGGATGT GTTTGAGACA 
TCGGACGTAG AAAGTGATCT CGAGTTGTCT CACCATCATA GTGAATCTAG TCCAACTCTA 
GAAGAAGATG ATTCGGAGAT CAAACACCAG CAATTGAATG CTGAAACTGC CAGAACTCGC 
TTTTCTCATA GTCTGTTGGT GCCCCAAGAT GGTGCAGACT TTCTGGGTAG CGTTTCTTAT 
CCCAAGCTTG GGAAATCGGG GTATTTGATC GAGACAACGG TCGAAACAAG ACAACAGAAG 
TTGGCAAGGA TAGCGCGAGA GCTAGAGGAA TTGAAGCAAG AAGGTGAAAA TGATGTGGAG 
AAAATATTTT CAGAAAATGT AGACGGTTTA CAAACTCAGC TCCAAGAAGT TCTTGAAAAG 
ACTGTTTCAG GAAGTAACTC CAAAATTCGC CAACTTGATG TATATAGTCA GAGGATTAAC 
CACCTTTTCG AAGCGATATC TAGTAATATT ATTAAAGGTG AAGTTTATGA AAAATCGGCG 
CCCCAGAATG AGGCTAGCTT TCAGAAATCG AGCACCTCGA CAAGTCCCAG TGAGATCCTT 
TCGCTTGAGA ATAGAATCAA CGAGTTGGAA AAGTTAATAG GTGTAGATAT GGTCCAGAGT 
TTGAGTTCCA AGCCCACTGG AACTACGGCA TCTCTTCAGA GCTATGTCAA TGACTTGAGT 
CGAAAGATCA ACATAGTGCA TAATCCTGAA TATCACATCG CCGCCGTGAA ACTGGAAGTA 
GAACTGCTCA TAGCGAAGAT GGATGAGTTG GAGACGAAGA GAAGGATTGC AGAAATACGG 
GAAACTACGC TTGGAAAACC TCAACAAAGT ATCAGTGAGT CTACACCCTT ACAGAAAAAG 
ATAGATGACT TATACAAAAA CTTACCAGAA TTTGAGAGAG CGAACAAGTT GGTGCCATCT 
GTAATTTCAA GACTTAAGTC TCTCAGCGTA GTACATTCAG ACTTGGCTGG TTGTACTCAG 
ACAGTAGGGG AGTTGGATAG TATTCTAGGT GATTTAAGGG ACGATATGAA ACGATGGGAC 
GACAGCTTAA ACGACGTTAA TGCAAAGATA GACAACTATG AGACCATTTT TGGGGAAAAT 
AGAAAGGTGG TGACGGCACA GATTGAGGAG TTGGAGAGCA AGATAGATAA AGTATTCAAA 
TAG

Protein sequence

MEKYHDLPDI DTNAPDVFET SDVESDLELS HHHSESSPTL EEDDSEIKHQ QLNAETARTR 
FSHSSLVPQD GADFSGSVSY PKLGKSGYLI ETTVETRQQK LARIARELEE LKQEGENDVE 
KIFSENVDGL QTQLQEVLEK TVSGSNSKIR QLDVYSQRIN HLFEAISSNI IKGEVYEKSA 
PQNEASFQKS STSTSPSEIL SLENRINELE KLIGVDMVQS LSSKPTGTTA SLQSYVNDLS 
RKINIVHNPE YHIAAVKSEV ESLIAKMDEL ETKRRIAEIR ETTLGKPQQS ISESTPLQKK 
IDDLYKNLPE FERANKLVPS VISRLKSLSV VHSDLAGCTQ TVGELDSILG DLRDDMKRWD 
DSLNDVNAKI DNYETIFGEN RKVVTAQIEE LESKIDKVFK