Gene PICST_41699 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_41699
Symbol
ID	4837361
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	253197
End bp	254948
Gene Length	1752 bp
Protein Length	557 aa
Translation table	12
GC content	43%
IMG OID	640388676
Product	predicted protein
Protein accession	XP_001382814
Protein GI	150864112
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.517646
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGTCT ACAAAGATGT CGAGAGAACA TCGAAATTGA AGACGTTCTC CAACCAGTCC 
ATCTTGATGT CGGCAATGGA AAGCTACAAC GATCAAGACG ACGACGACGA CCAAAGCAGT 
GATGTTGACT TCAGTTTCGC TTCCAGTGAA GAGGAGGAAG AGGAGGACTA TAACGACATG 
ACGCCGGAAG CAGTGGAAGC GGTGAAATAC TTGAAAGGTG TCATCGGCCA GATTGCGAGC 
CAGACTAAGA AGTTGAATAA CGAGTTCGAG AAATTGGCGA ACAAGAAGTT AAGAAAGAAC 
AACTTGAGCA CTATCGAAAG TAAAAAGGAG AAGATACAAT CTACAGTGGA ACTGAATAAG 
TTCCACACCA AAAAGCTCTT TAAGGTCATC AAGTATGTCC GAGCCAACAA GATGTCCGAT 
ATGAACTTAA TCTGGTTGAT AAAGGACGAC TTGAACAACT ACTTGGAGAA CAACGGCAAT 
ATTGATTTTA CAGACGACAC ATCCATATAT GATGACATCT TCAATCTGGT AGTCATAGAA 
GATGACTACT CCGAATTCAA CGACTCAGAA ATACACTCCA ATACAAGTAG AGACCCAGAA 
GAGGTACCAA TCAAGAACGG AAGTGCCAAC AACAATGTGC TAGGAAGACT AAGCTCTGGC 
ACTGTGGAAA CGAGGACACA ACCGAACCAC ATCAACACAT CCATACCAGC GTCACCTGTA 
AATAAACACA TGAGCCCAGA GTTAGCAAGT CCAGCTATTG TCAGAACACT TAAGCCAGCT 
TCCACACCTT CAAAGCCCGT AGGGAACTTA AAATGGTCTA CAGCAGCAGC AGGTATCCTG 
GAGGTTTCCG AAGAAAGTCA CTACGAAAGC AGTAGAGCTT CGGCAGCTTC TTCCGTAAGT 
CCCAAAGTGA CTAATGGTTC TACTACTGTT GCTCCATTGA GCACCGTGAA ATCTTCTTCC 
AGTAGAGTAG AGACCAAATT CGTCCATGTC TTGGAGAATT CGTCATTGCC GCAATCTGAG 
TTGAACTTGT TCAGTGACTT AAACTTAGTC AAGTTGCCGC CAGGAATGCA AGATTTGATA 
ATATCATTCA CATCTAAAAG AAATAACCCC GAAGACTTCA AGTTGCTCTG TAGCACCCGC 
AGCTACAATC AGTACGTGAC TCCAATCAAG AAGTGCAACT TCCCAGAACT TGATGCAGCA 
GGAAATGTAG GTGGAAACAA CAATAATAAA CAATTCAAGC CACCGGTGCA GTTATTCAAG 
TTGCTGTCGT ACTGGAATAG AATCAGAGCT AATGACGAGT TTGATAGAAT CTTGGAAGAG 
ATACAGACAT TAAGTGAAAA AGACTCTGGC GAAGGCAATC CAATAGCAAA CGAGTTGACG 
TTGGTGTTGT TTTATGGATT CTACTTTGGT TTCACGCCTG TGGAAAACTT GATTGCCGAA 
TCGTGCTTGT TCAAGTTAGG CTGGAGACCA TACAATACCA ATCACAGCGA CTCTTCACAG 
TTAAATCAAA GCCAAAACCA GATATCGTCA CCATCCAGTA ACGGAAAGGT TTCGCAGTCT 
TCAAAGGACA AAGTAACAGT GCACAGCTGG GTTAGACGTA TTAAGTTATT GTCGAATTCA 
GAAGAATCCA CAGCCTTTGA GATTGGAGAC TATCAGGTGT TTGACTTGTC TTTCTGGGAA 
GTCTACATCA AGTACGGCTT CACATTGGAC CTCAGTCTCT GTAAAACAGA GCCAACCAGC 
GCCATTTGCT AG

Protein sequence

MEVYKDVERT SKLKTFSNQS ILIEEEEEED YNDMTPEAVE AVKYLKGVIG QIASQTKKLN 
NEFEKLANKK LRKNNLSTIE SKKEKIQSTV ESNKFHTKKL FKVIKYVRAN KMSDMNLIWL 
IKDDLNNYLE NNGNIDFTDD TSIYDDIFNS VVIEDDYSEF NDSEIHSNTS RDPEEVPIKN 
GSANNNVLGR LSSGTVETRT QPNHINTSIP ASPVNKHMSP ELASPAIVRT LKPASTPSKP 
VGNLKWSTAA AGISEVSEES HYESSRASAA SSVSPKVTNG STTVAPLSTV KSSSSRVETK 
FVHVLENSSL PQSELNLFSD LNLVKLPPGM QDLIISFTSK RNNPEDFKLL CSTRSYNQYV 
TPIKKCNFPE LDAAGNVGGN NNNKQFKPPV QLFKLSSYWN RIRANDEFDR ILEEIQTLSE 
KDSGEGNPIA NELTLVLFYG FYFGFTPVEN LIAESCLFKL GWRPYNTNHS DSSQLNQSQN 
QISSPSSNGK VSQSSKDKVT VHSWVRRIKL LSNSEESTAF EIGDYQVFDL SFWEVYIKYG 
FTLDLSLCKT EPTSAIC