Gene PICST_47989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_47989
Symbol
ID	4840138
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	+
Start bp	205831
End bp	207153
Gene Length	1323 bp
Protein Length	440 aa
Translation table	12
GC content	40%
IMG OID	640391453
Product	predicted protein
Protein accession	XP_001385374
Protein GI	150865951
COG category	[T] Signal transduction mechanisms
COG ID	[COG5409] EXS domain-containing protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.129932
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCAAA ACCAAAAAAA ATCCGACGAG ATTCTCTTCG ATGACTTGGT GCCGCTTCCA 
TTCCGAATCC TTTTTCTCGT CCAACTCGGA GTTTTTTTCT GGTACTACCT AGTCTATTCG 
TGTTACAACT TGAGGAAGTT AAACATTTTG CACCTAATCA AGTTGTCATA TTCAGCACAT 
GACTACTCAC AACTCGATGA CCACTACATA CCCAATGGAG AGTTTGCTAC GACTCTCGTT 
CCGGATTTCA ATTCCAACCT CATTCTAGCC AATGGAATTT GGGCTAACCT TCGACCTGTG 
ACTATCGTCA ATGTTATAGG TTGGGCTGTG TTTAAGATTA TTCAACGTAA AGTGAGTCTG 
AACGACGATG TTTCGCCAGC CATTTTTATT CCGTTGTCCT ATGTGATCCC GTTAGCATTA 
TTTTTTCATT TGTTCTATAG ATTGTTCTAC AAATCCAAAG TGCAAAATTC TATGGGACAG 
TACAGAGCAT TTACCACCAT GAAAAGAATC TTGTTGGGTA AGATAAACTC TAGCACAATG 
AGAACTAACG ATATTTTGAT ATCAGATAGT TTGGTCTCCT ACAGCAAGGT ATTGAATGAC 
TTCGGCTTGT ACCTTTGGAA CTACTACTAC GCCAGAGACA TACCATACAG TGTCGAGTTA 
GAATTCATTT TACTATGTAT ACCGACATTT ATTCGCATGA AGCAATGTTA TTCTGAATAC 
AGAAGCACCG CAAACAGACA GCACTTATTC AATTTCATCA AGTATTCTAC AACCTTGGGT 
CCATTATTCG TAAACCTGTT GATCAAATCT ATTATCACTT CGCCAGGAAA GGATCTTAAT 
GAACCTGCAT TCTTGGACAA ATTGCAGTCC TTGAACAGGT GGTGGTACTT GCTTTCGTTT 
GTAAACTCAA CGTATTCGTT TATTTGGGAT GTGAAGATGG ACTGGGGGCT TAAGATGTTT 
GATTTTCTCT TCGAATCCAA AACTTACTAC TTCAAAATGG TTCTCTTGAG ACCTAAATTA 
GCATTTGAGC CCGTTGTCTA TTTCGCTGTC ATCTTGTTTG ACTTCATAGT GAGGTTTGTC 
TGGATTCTCA AAGTTTTCAT TGTTAAAGAA GGACAGGACC AAGTCAAATG GACGACGTTG 
CATATGTTGT CAACCTTTTT ATTCGGTTAC GATGCATTTT CGTTTGGGTA CACCGTGATT 
GAATTCCTTG AGATCCTCCG TAGATGGGCC TGGTGTTTCA TCAAACTCGA CTCAGACTGG 
GCCACGCTTG AACAAGCTAC CGGTAACGAT ATTGAGTTGG TCAATACCTC AAAATTGGGC 
TAA

Protein sequence

MDQNQKKSDE ILFDDLVPLP FRILFLVQLG VFFWYYLVYS CYNLRKLNIL HLIKLSYSAH 
DYSQLDDHYI PNGEFATTLV PDFNSNLILA NGIWANLRPV TIVNVIGWAV FKIIQRKVSS 
NDDVSPAIFI PLSYVIPLAL FFHLFYRLFY KSKVQNSMGQ YRAFTTMKRI LLGKINSSTM 
RTNDILISDS LVSYSKVLND FGLYLWNYYY ARDIPYSVEL EFILLCIPTF IRMKQCYSEY 
RSTANRQHLF NFIKYSTTLG PLFVNSLIKS IITSPGKDLN EPAFLDKLQS LNRWWYLLSF 
VNSTYSFIWD VKMDWGLKMF DFLFESKTYY FKMVLLRPKL AFEPVVYFAV ILFDFIVRFV 
WILKVFIVKE GQDQVKWTTL HMLSTFLFGY DAFSFGYTVI EFLEILRRWA WCFIKLDSDW 
ATLEQATGND IELVNTSKLG