Gene PICST_56847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_56847
Symbol
ID	4837921
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	1619810
End bp	1621210
Gene Length	1401 bp
Protein Length	451 aa
Translation table	12
GC content	46%
IMG OID	640389236
Product	predicted protein
Protein accession	XP_001383933
Protein GI	150864921
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTTC CTTCTTTTAT GCCCCATGGC TCAAACCCAC AGACAGCCTC TTTCACCTGT 
AATACCTGTG GAATCAAGTT TGTCACGGCA GAGTTGCAAA GACAGCATAT GAAGACCGAC 
TGGCACCGGT ACAATCTAAA GAGACGTGTG GCGGAGTTGC CATCGATCAC CTCAGACGTT 
TTTGCCGAAA AAATATTGAA CCAGCAAACT TCTCAGGAAC CTGCTGAGGA GGACGAATAT 
GGATTCTATG TAGCCCGTAG AAGGACCAAA GCCACCGGAA ATGGCAGGCA GATCACCAAG 
AAGTTGATCA AACAACAGCA AAGACAATTA CACGAAGCCA GAGGAAGACC AGAACAGTCT 
GAAGTTGTTT CTGGATCTTC CTTGAGAGCA GCTAGTCCTG CGACTTCCAT AGCTTCGGAG 
TTTTCGCAAT TTTCACTTGG TGATTCCGAC CAACTTCATG AAGTGGCTTC TACCACAGAA 
ACAGGCTCTG AGTTAAACTA CTCGGAGTCG GACTTCACTG ACTTGGAAGG TGACTTACTA 
AGCGAAGAAG ACGAAGTGGA AGACCATGAT GCAGATGTAG AGTCGGAGTC AGAGTCGTTG 
CAAGAAATCG AATCTATACC GATCACTCAT TGCTTCTATT GTGGGGACAA CAACCATGAG 
GTGGAGAACA ATATTAGACA TATGTACAGT AGGCACGGGT TGTATATACC CGAAAGATCT 
TACTTAGTGG ATTTGGAAGG GTTGCTCCAC TTTTTGAGCG AAGTAGTTTC TATAGACCAC 
GAGTGTTTGG TGTGTGGCTT TGAGGGTAAA AACTTGGAGA GTATCAGACA GCATATCTAC 
GCCAAGGGTC ATTGCAAGAT TCCGTATGAG AGCAAGGAGG AAAAACAGGC GATGGCGGAG 
TTCTACGACT TCTATACGGA GGAGGAAAAG CCGAAGAGAG CTAGCACTTC GAAATCAGTT 
GCATTTAAAG AAGTTGATGA TCAAATACTT GTGGATGTTC ATGAAGATGA ACAAAGAGAG 
GAGGATGACG ATGAAAATGT TGATGATGAC GATAGGATGG CAATCGACAA CGGAATCAAC 
GACAACTACT CCTTGGTTCA CGTAGACAGA AGCGGGGTAG AGTTGACATT GCCTACTGGC 
TCGAGAATTG GCCACAGGTC CATGGCAAGA TATTATCGCC AGAACATCGC CTTGCCCACT 
GAGCCCAGTG AATCATCCAA GACGGTGGCT CTTGTGGATC GTAGATTTGC ATCGGGATTG 
TCTGCATATC AAGTCTCGAA GGAGGAGAAG GAGATCAGAA AGATCGAGCT GCAGGTCAGA 
AACAACTACG AGAGAAAGAC CAAGAACAGG AGAGTTAACT TCCAAAAGCA TTTCCGTGAC 
GAGCTCTTGG GACCCATGTA G

Protein sequence

MSVPSFMPHG SNPQTASFTC NTCGIKFVTA ELQRQHMKTD WHRYNLKRRV AELPSITSDV 
FAEKILNQQT SQEPAEEDEY GFYVARRRTK ATGNGRQITK KLIKQQQRQL HEARGRPEQS 
EVVSGSSLRA ASPATSIASE FSQFSLGDSD QLHEVASTTE TGSELNYSES DFTDLEGDLL 
SEEDEVEDHD ADSLQEIESI PITHCFYCGD NNHEVENNIR HMYSRHGLYI PERSYLVDLE 
GLLHFLSEVV SIDHECLVCG FEGKNLESIR QHIYAKGHCK IPYESKEEKQ AMAEFYDFYT 
EEEKPKRAST SKSVAFKEVD DQILVDDDDE NVDDDDRMAI DNGINDNYSL VHVDRSGVEL 
TLPTGSRIGH RSMARYYRQN IALPTEPSES SKTVALVDRR FASGLSAYQV SKEEKEIRKI 
ESQVRNNYER KTKNRRVNFQ KHFRDELLGP M