Gene PICST_56149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_56149
Symbol
ID	4837200
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	+
Start bp	2010402
End bp	2011514
Gene Length	1113 bp
Protein Length	370 aa
Translation table	12
GC content	45%
IMG OID	640388515
Product	predicted protein
Protein accession	XP_001382614
Protein GI	150863957
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.462379
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.700451
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCTACA TCAAGAATCA GTATATTCGT TATATACGAA AAAAGCCTTT ATCATTGATA 
GCACCGATTT CCGTGTTATT GCTCGTGTAT TTCTACTTCT TTGCGGCACA TGGCTCTTCC 
TCCTCATCTT CTGGCAACAA ATACAGCTAC AAGAAGAAAT CCCGAGGTTT GTTTGCAAAG 
AACAGAGACC TGGTGATTCT TAAAAACTTG CCTAAGAATC ACATCAGCCA CTACGACTTG 
AACAAGTTGT CCACTTCTGC CGATTCGCTT GCAAAGAAGG AGGAGGTGTT GATTTTGACG 
CCCATGTCAC GTTTCACGCC ACAGTACTGG GATAACATCC AGAAGTTGAC GTATGAACAC 
AGCTTGATTC TGTTGGGATT CATTTTGCCT CGTAACAAAG ACGGTGATGT AGCACTTAAG 
CATTTGGAAG AAGCAATCAA AGACGCCAAA GCGGCCAACC AGTTGAAATA CAAGAAGATC 
ACCATATTGA GACAAGACAC GAACTCTCTT AACTCGCAGT TGGAGAAGGA CAGACATGCA 
CTCAATGTGC AGAAAGAAAG AAGACTGATG ATGGCTCTTG CCAGAAATTC GTTACTTTTC 
ACGACTATTG CGCCAACTAC GTCTTGGATT TTATGGCTAG ATGCCGACAT CGTAGAAACT 
CCTGCTGGAT TGATTCAGGA TTTGACGTCA CACAATAAAC CAGTTATTCT GGCCAACGTG 
TACCAGAGAT ACGAAGACGA ATCGACACAA CAACCATCCA TCAGACCGTA TGACTTCAAC 
AACTGGGTAG AATCAGAAGA AGGCTTGAAA ATCGCTGCAG GTTTGGCAGA CGACGAGATT 
GTAGTTGAAG GTTACGCTGA GATGGCTACC TACAGACCGC TCATGGCTCA TTTCTATGAC 
GCCAAAGGTG ACGTCCATAC CGAAATGCAA TTGGATGGTG TTGGAGGAGG TGCTGTCATG 
GTCAAGGCTG ATGTCCACAG AGATGGAGCC ATGTTCCCTT CGTTTCCATT CTACCATTTG 
ATAGAAACAG AGGGTTTTGC CAAGATGGCT AAACGCTTGG GCTACGAGGT GTTTGGTTTG 
CCCAACTACT TGGTATACCA CTTCAACGAG TGA

Protein sequence

MVYIKNQYIR YIRKKPLSLI APISVLLLVY FYFFAAHGSS SSSSGNKYSY KKKSRGLFAK 
NRDSVILKNL PKNHISHYDL NKLSTSADSL AKKEEVLILT PMSRFTPQYW DNIQKLTYEH 
SLISLGFILP RNKDGDVALK HLEEAIKDAK AANQLKYKKI TILRQDTNSL NSQLEKDRHA 
LNVQKERRSM MALARNSLLF TTIAPTTSWI LWLDADIVET PAGLIQDLTS HNKPVISANV 
YQRYEDESTQ QPSIRPYDFN NWVESEEGLK IAAGLADDEI VVEGYAEMAT YRPLMAHFYD 
AKGDVHTEMQ LDGVGGGAVM VKADVHRDGA MFPSFPFYHL IETEGFAKMA KRLGYEVFGL 
PNYLVYHFNE