Gene PICST_19003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_19003
Symbol
ID	4838389
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	1586818
End bp	1588053
Gene Length	1236 bp
Protein Length	412 aa
Translation table	12
GC content	41%
IMG OID	640389704
Product	predicted protein
Protein accession	XP_001384608
Protein GI	150865405
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0445647
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0373954
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TACACCATTT TTCTCTTGCT CCACTCTCTT TTCACATTAG TTGCCCCAAC ATGGTACTGG 
AAAGAGCACA AAGTATGTGA TCCTAGTCTG CTGAACATGG TACCTTCTAC TGGGTTCAAG 
ATCAACAGAC AATACAAGAT CAGTGGTTTA TTTCCTCCTT TCAGTATGCA TTTCATACAA 
ATTTCACATT GTGACCATGG GCAAGTTGAC TACCAGAAAG TAAAAAGAAC CATGTCCAGC 
ACAGACATAG ACTGGGATAA GCCCTTCTGT ATGCTCAAGC CTAAGTTGGG AGATGTACTA 
TCTTTACCAC CCGAAGACAC AGTAGAGAAC TTGTTGCCTG GAAATAATGG TACGATTTCT 
GGATATTCAG AAATTCCTAA TAGTCGTTTA GAGCGTTTTG GTCAGTTTGT GAGGAATAAA 
TTTGACAAGG CATTGGAATC GTTGACTGCG GGCAAGAGAA TCCAGTATAA GGGGAATATA 
GCTTACCACC ATTTAGAGGA TATCAAACAA GCTGATCCGC AATCTTCCTT TGAATGGGAA 
TCACGAAACC TAGTTTGCTA CAAGATGGCT CGACGAAAGA AGTATGCCAA GAGAGATGTT 
TCTTTCTACA TGCCAAATAC TTTTGTAGGA GGACTTTTTG AATGTCCTGT TCTGGCACAA 
CAGAAGAAGA CTTTGTTCCA ACAGTTTGGC AATGAAGATT TTCTCAAAAG CCTTGATTTT 
GATTGTGATA GTTCTTTGGC CAGACCAATT CTACCCTTGA TTGCTCAAGA TAGTACTCAA 
CAATGGATAG ATACCAATTT CAAAGATTTT CTTAACCCTT CGATCGTCCA GACGATACCT 
TACTTGGCCA CAGCTTCTCC ATGGAATCTA CGGTTTTCCC TTAGTAACAC AGCTGACATG 
AATAGCGACA CATGGGCAAC CAAAATCGAT GTTAATGAAC AGTATGTCTA TTCTGAGCTG 
GAGGTGCATG TTATATCTCG TGCAGTGGCT GTTTCTGCCG ATTACTTGAA CAGAATCATC 
TCTCCTATTG ATATCAACAA GTTTCTGCAG AGATATAATA ACTGGCTCTC TAAGTCCCAG 
CAATGGGAGA ATCCTATTTT AGAAGAAGGT GATATGACCA AGATCATGCT GAGCCTCTCA 
TTTGACCAAA GGTTGCAGCT CATTATCTCA AGCAAGACCA GGAAGGTTGC CATGGAACAA 
ATACAGAAGC TTCAGGACTT GTGGGATCAA CTACAA

Protein sequence

YTIFLLLHSL FTLVAPTWYW KEHKVCDPSS SNMVPSTGFK INRQYKISGL FPPFSMHFIQ 
ISHCDHGQVD YQKVKRTMSS TDIDWDKPFC MLKPKLGDVL SLPPEDTVEN LLPGNNGTIS 
GYSEIPNSRL ERFGQFVRNK FDKALESLTA GKRIQYKGNI AYHHLEDIKQ ADPQSSFEWE 
SRNLVCYKMA RRKKYAKRDV SFYMPNTFVG GLFECPVSAQ QKKTLFQQFG NEDFLKSLDF 
DCDSSLARPI LPLIAQDSTQ QWIDTNFKDF LNPSIVQTIP YLATASPWNL RFSLSNTADM 
NSDTWATKID VNEQYVYSES EVHVISRAVA VSADYLNRII SPIDINKFSQ RYNNWLSKSQ 
QWENPILEEG DMTKIMSSLS FDQRLQLIIS SKTRKVAMEQ IQKLQDLWDQ LQ