Gene PICST_47685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_47685
Symbol
ID	4840283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	-
Start bp	671593
End bp	673158
Gene Length	1566 bp
Protein Length	521 aa
Translation table	12
GC content	40%
IMG OID	640391598
Product	predicted protein
Protein accession	XP_001385832
Protein GI	150866286
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.773754
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAACC AACTCACCTT GGAAGAACAG CTGGAGGGCC TCCCTCTTTT CCAGTTGGTA 
ATTATTGGAT GTCTCCAAAT TGGTCAACTG ATAGCTTTTT CTTCCATGTA CCCCTATATT 
TACTCCATGG TTAAGTATTT TGATATTGCT GACAACGATT CACAAATCGC CACATACAGT 
GGATATTTGG CAGCTGCTTT TTCACTCGGC GAGTACATGA GCTTGCTGTA TTGGTCCAGT 
GCCTCAAATA TATATGGCAG AAAAACCATA CTCTTGTGTG GCTGTGCTGG TACAGCATTT 
TCGATAGTTC TCTACGGCTT TAGCACGAAC TTTTACATGG CGCTTTTTGC GAGATTGTTG 
ATGGGAATAT GTAGTGGTAA TACTGAAGTC TTGAGAATTA CAATAGATGA AATTGCCCCC 
GAAGATAGAC ACAAAGGTTT CGCTTTCGGC AATATCTTTC TGATCTCAAA CAAGTATAAA 
TTCATTGGGT ACTCCTTGGG AGTTCTCGGT GAATCTAGCG TATCTAAGTC TGCTTCTAAG 
AGCCGGAGAG AAGATGGATT TTCAATTCCA AGCTATCCAT TTCTTCTTCC CAGCCTCATA 
GCAGGAAGCT TTGTTGTATT TTTCATCAAC ATCGGTTGGC TCTTTTTGGA AGAAACACAT 
GAGCGAATAA AGTATGAGCG TGACATTGGC ATAAATGTTG GAGATTCTAT TAGGCGTCTA 
TTGAGAATAC GAGTACCGGA AAGGCCATGG AATCTGAGAG AACAATACCT AAAAGTTGAC 
CATCAACTAT TGGAGGGAAA AATTGATTCT TCAGAATTGC CCTACTACCC CACCAAAAGC 
AGATCTCTTT CTGTAGAAGT TGCAGATTTT GAAGAACCCT CGCAAAGCGA AACAGGCACA 
GAAACAAGCG ATCCTATAGC ATTACCTGCC GTAAGAAATC GCATGATTAA CAATTTTATG 
TTCTGCTTTC ACGGTGTATT CTACTTCGAG TTTCTCCCAA TTTTACTTGC CACTAAACTT 
AGAATAGAGG ACATGAAGTT CCCATTTCAT GTTAGAGGAG GGTTCGGTTA CAGTTCAATA 
GGAATTGGAA TTCTTGTAAA TAGTTCGGCA GGTATTGGGT CATGTGTTGC TATGTGGCTT 
ATTGTTTTTG TTAAATATTG TGGTATAAAG CCTGTGTCTC TTGGCTTGAT CGTATACCCC 
ATTGTTTACT TTTTATTGCC CTTACTTCTT TTCACACTGC ACCAGTACAA TAATGGAATA 
CCAGAATACG TACCGGTATT ATTGCTTTTC ATTATAATAC TTGTTGATTT GTCAGCTGAC 
TTTCTTACTA TTTCCCGATT CCAAATTTTC TTCGACACTA CGTCTTCCAA GGAGGAGAAA 
CAGCTAATTA GTAGATATTC AATCAGAGTC ATCAGCTTAG CAAAGTGTTT AGCCCCAATT 
ATTGGAGGTT GGATGATATC GAAGTCCGAG ACACACGGTT ACAGCGAATT GCCTTGGTGG 
GCTCTTTCAG TTTGGTCAAC GATAACACTA TTACATTCTA ATTACATCGA TAAGAGTGCC 
TGGTGA

Protein sequence

MTNQLTLEEQ SEGLPLFQLV IIGCLQIGQS IAFSSMYPYI YSMVKYFDIA DNDSQIATYS 
GYLAAAFSLG EYMSLSYWSS ASNIYGRKTI LLCGCAGTAF SIVLYGFSTN FYMALFARLL 
MGICSGNTEV LRITIDEIAP EDRHKGFAFG NIFSISNKYK FIGYSLGVLG ESSVSKSASK 
SRREDGFSIP SYPFLLPSLI AGSFVVFFIN IGWLFLEETH ERIKYERDIG INVGDSIRRL 
LRIRVPERPW NSREQYLKVD HQLLEGKIDS SELPYYPTKS RSLSVEVADF EEPSQSETGT 
ETSDPIALPA VRNRMINNFM FCFHGVFYFE FLPILLATKL RIEDMKFPFH VRGGFGYSSI 
GIGILVNSSA GIGSCVAMWL IVFVKYCGIK PVSLGLIVYP IVYFLLPLLL FTSHQYNNGI 
PEYVPVLLLF IIILVDLSAD FLTISRFQIF FDTTSSKEEK QLISRYSIRV ISLAKCLAPI 
IGGWMISKSE THGYSELPWW ALSVWSTITL LHSNYIDKSA W