Gene PICST_33021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33021
Symbol
ID	4839795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	-
Start bp	1243227
End bp	1244255
Gene Length	1029 bp
Protein Length	342 aa
Translation table	12
GC content	48%
IMG OID	640391110
Product	predicted protein
Protein accession	XP_001385933
Protein GI	150866361
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2152] Predicted glycosylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCTCC CAGTAGTCTC TAGAGCCTCA ACTCTCGGCG ACAGGAACTA CAAGGCCCCC 
ACTAAGTTCC CCATCGGGCC GTTTCAGAAG TACGAGAACA ACCCCATTCT CACGCCAAAC 
CCTGACAACG AGTTTGAAAG CGCATATATA TATAATGCAA CTGCCATCGT TGTAGACGAC 
AAAGTGTACT TGCTTTATAG GGCCCAGAAC GCAGCCAAGT TGTCACTGGT GGGTCTAGCC 
TGGTCAACAG ACGGGGTCAA CTTTGTCAGA TACCATAAAC CTATCATCAC AGCCACAGAG 
CCCTGGGAAC AGGGTGGAGG AGTTGAAGAC CCAAGAATCG TTAGAGACCC CGTGTCCAAG 
CTCTTTATTG TCACGTATAC CGCCTACGAT AAACATTTTG CTCGTCTCTG TGTAGCTACC 
TCGGAAGACT TGTTCAACTG GAACAAACTT CCCTCGTTCA TTCCACCAAC TTGGCATGAT 
GTCTCATACG ACGGAAATGG AAACCCAAGT ATTCGTCGTC AATGGCTGAA GTCGGGTGCC 
ATCTTCACCG AACGGGCTCC AGATGGTAAG TACTACATGA TCTGGGGGGA CAGCGCCTTG 
TATTTGGCTG AGTCTGATGA TTTGGTTCAT TGGAAACTAC CTACTCAAGA CTTCAGACAA 
GATACCTTTG CTGGAGTCCA GTACGATTTC GAAAGCAAAT TGATTGAGCT GGGTCCCGCA 
CCGGTCAAGA TGGGAAATGG TACAAATCAG TGGATCTTCG TCTACAATGC TGATACGACA 
GGAACAGACG ACTTGCCTGC TAATACTTAT ACCATCAGTC AGATGCTTGT CGACTACGAC 
AACATTAAGG CTGGACCTGT AAAAAGGTTG TCTGAGCCCA TCCTCAAGCC TGAAAAAGAT 
AACGAAAAGA ATGGCCAGGT TAACAAGGTT GTATTCTGCG AAGGCATGGT CCAGTTCAAG 
GGCAAGTGGT TCTTATACTT TGGCCAGGCA GATTCCGAAT TGGGAGTGGC TATTGCTCCG 
GTAGACTAA

Protein sequence

MMLPVVSRAS TLGDRNYKAP TKFPIGPFQK YENNPILTPN PDNEFESAYI YNATAIVVDD 
KVYLLYRAQN AAKLSSVGLA WSTDGVNFVR YHKPIITATE PWEQGGGVED PRIVRDPVSK 
LFIVTYTAYD KHFARLCVAT SEDLFNWNKL PSFIPPTWHD VSYDGNGNPS IRRQWSKSGA 
IFTERAPDGK YYMIWGDSAL YLAESDDLVH WKLPTQDFRQ DTFAGVQYDF ESKLIESGPA 
PVKMGNGTNQ WIFVYNADTT GTDDLPANTY TISQMLVDYD NIKAGPVKRL SEPILKPEKD 
NEKNGQVNKV VFCEGMVQFK GKWFLYFGQA DSELGVAIAP VD