Gene PICST_36445 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_36445
Symbol
ID	4839731
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	+
Start bp	1510779
End bp	1512203
Gene Length	1425 bp
Protein Length	474 aa
Translation table	12
GC content	44%
IMG OID	640391046
Product	predicted protein
Protein accession	XP_001384979
Protein GI	150865666
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0311033
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.112227
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTTGG TCAACGATGC CATTGACGAA ATTGGTTTCA CTCCATATCA TTTGAAACTC 
TTCTTCCTTA ATGGTATGGG TTACTGGACC GATACTCAAT TGACATACCT TGAAAGTTCA 
GTGAGAACCT TTGTCAATTA CCAATTTGGC TACACCTATG CTGTGTCCAA CGAGATGTTG 
GCTGCTGGTC TTTTGGTCGG TGCCATTTTC TGGGGGTTTT CTGCTGATTT GATCGGAAGA 
AAGATAGCTT TCAACCTTTC GTTGTTACTT TCGGCTGTCT TCACAATCAT CACTGGTACC 
ATGGGAACCA TGGCTTCATA CTGTATCTTT GTTTTCTTGC TGTGTTTCGC TGCTGGAGGT 
AACTTGGTAC TTGACACTTG TGTTTTCCTT GAATACTTGC CTCACAAACA CCAATGGCTT 
TTGACATTTT TCGCCTTTTT CTGGGGTATT GGTCAAACCA TTGCTGTTTT GCTTGCATAC 
GCTTTCTTGC CTAACAACTC ATGTTCATCC GCTGACGACT GTCCTTCTCA CAAGAACAGG 
GGCTGGAGAT ATGTCTACTA TGTCAATGGA GCCATTGTGC TTGTCATGGC TATTTTGCGT 
ATCACTGTCA TCAGATTAAA GGAGACGCCT AAGTTCTTGG TTTCCAATAA CAGAGATGCT 
GAAGCAGTAG AAGTTTTGCA ATCGATTGCC CGTAAATACA ACCGTCAATG TTCTTTAACT 
CTCGAACAAT TGAATGCTAT TGGAGAAGTC AAGTCCAGTG ACGATTACAG AAAGCACTTA 
AACGTCAAGG GCACTTACAC TTTGGTTAAG CACCATCTCA CCATCTTGTT TGCCAACAGA 
AAGACTGCCA GACTGACGAT CTTATTGTTT CTCTCTTGGT TCCTTCTTGG GTTTGCTTAT 
CCCTTATACT CGTCTTTCTT GCCGGTATAC TTGGCTACGA GAGGTAATAA TATTTCTGCG 
CCAGATGTAC ATGGAGTTTA CCGTGACAAT TTGATTAGTA ACGTGTCTTC CATGGGTGGT 
CCATTCATTG CTGGAGCTTT GTTGTATTTC TTTCCGGCCT TGGGAAGAAG AGGAGTCTTG 
TGTATAGGTG GTCTCGTCAG TATGGCCTTC CTCTTTGGCT ACACCCAGAT CAAGAACAGA 
GCCCAAAATG TGGCTCTTTC GTCGACTTCA TTCCTTGCCA TCTATATCTA CTATGCTGTG 
TTGTACGCTT ACACTCCGGA AGTGTTGCCC TCAGCAGCAA GAGGTACAGG TAATGCTCTC 
AGTATTGCTT GTACTCGTGT AGCCAGTTTG GTTGTGCCAG TCATTGCTTA CTTCTCTGAC 
ACTAGTTCTG CAGTTCCGAT CTGGATCTGT GGTGCGTTTG TTGGAGTGAT TGGTTTGATG 
GCATTGTTGT TCCCATTCGA ACCAAGTAAG CACAGAGTTG TATAA

Protein sequence

MHLVNDAIDE IGFTPYHLKL FFLNGMGYWT DTQLTYLESS VRTFVNYQFG YTYAVSNEML 
AAGLLVGAIF WGFSADLIGR KIAFNLSLLL SAVFTIITGT MGTMASYCIF VFLSCFAAGG 
NLVLDTCVFL EYLPHKHQWL LTFFAFFWGI GQTIAVLLAY AFLPNNSCSS ADDCPSHKNR 
GWRYVYYVNG AIVLVMAILR ITVIRLKETP KFLVSNNRDA EAVEVLQSIA RKYNRQCSLT 
LEQLNAIGEV KSSDDYRKHL NVKGTYTLVK HHLTILFANR KTARSTILLF LSWFLLGFAY 
PLYSSFLPVY LATRGNNISA PDVHGVYRDN LISNVSSMGG PFIAGALLYF FPALGRRGVL 
CIGGLVSMAF LFGYTQIKNR AQNVALSSTS FLAIYIYYAV LYAYTPEVLP SAARGTGNAL 
SIACTRVASL VVPVIAYFSD TSSAVPIWIC GAFVGVIGLM ALLFPFEPSK HRVV