Gene PICST_30682 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_30682
Symbol
ID	4837843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	+
Start bp	668510
End bp	669529
Gene Length	1020 bp
Protein Length	339 aa
Translation table	12
GC content	42%
IMG OID	640389158
Product	predicted protein
Protein accession	XP_001383411
Protein GI	150864551
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.673385
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0672265
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATCAA CCAAAGCTCT TCCATATCCA GATGAAGTCA ATATTGACAA ACTACAAGGT 
ACCAAGTACG ATTTCGCCAG AGATTTGATT GGCTATGGTG AAAAGTCACT AGATGCTAAA 
TGGCCCAGTG GCAAGAAGGT TGCTATTTCC TTTGTGTTGA ATTACGAAGA AGGTGGTGAA 
AGGTCGCTAT CCTTGGGAGA TGACACTCAA GAATTCACCT TGACTACTCC ATCAAAAGGT 
GTTCCTATTC CATTTAGACT GTTTGATCTT GAATCCGAAT ATGACTATGG TTCCAGAGCC 
GGTGTGTGGA GAATCTTCAG ATTGTTCAAG AAGTACAATT ACCCGCTCAC TGGATACATT 
GTTGGTAAGG CTGCTGAAAG AAATCCAGAG GTTATGAAAG CATTTCTCAG GGATGGCCAC 
GAAATCGCTT CTCATGCCTA CCGCTGGATC CCTTACGCTG GATTGGAACC GGAAGTGGAG 
AAAGGATATA TTATCAAGCA ATTGCAAGAA CTCAAGAACA TCACTGGTGA ATACCCCAAG 
GGCTGGTACT ACGGGAGACT TTCCACTCAT GCCTTGGGTT TGGTTACTGA AGTATACAGA 
GAGCTCGGTA TTCCTCTTGA ATACATCAGT GACTACTACG GTGACGATGT TCCAAGATGG 
ATCGAAGTTC CTGCGGAAAA AGATTTACCA AAAGAAGAAA AGAAGGGTTT GTTATTGGTT 
CCTTACTCTT ATGACTGTAA TGATTTCAGA TTCTTGAACC CTAATGGTTT CAGATCCGAT 
TCAGCTTTCT TGGAACACTT GATCAATGCG TTCACGACCT TGTATGAAGA AGCTGACGAA 
TGTGGAGCAA AAATGATGAC AGTTGGTCTT CATTGCCGTA TTATTGGTAA GCCAGGCTAC 
TTCCAATCGT TAAAAAAGTT TATTGAACAC ATTAGTCAAT TTGAAGACGT GTGGGTTTGT 
CGTAGAATTG ACATTGCCAA TCATTTCAAG GAAACCTTCC CATATTCTCC TTCAGAATAA

Protein sequence

MQSTKALPYP DEVNIDKLQG TKYDFARDLI GYGEKSLDAK WPSGKKVAIS FVLNYEEGGE 
RSLSLGDDTQ EFTLTTPSKG VPIPFRSFDL ESEYDYGSRA GVWRIFRLFK KYNYPLTGYI 
VGKAAERNPE VMKAFLRDGH EIASHAYRWI PYAGLEPEVE KGYIIKQLQE LKNITGEYPK 
GWYYGRLSTH ALGLVTEVYR ELGIPLEYIS DYYGDDVPRW IEVPAEKDLP KEEKKGLLLV 
PYSYDCNDFR FLNPNGFRSD SAFLEHLINA FTTLYEEADE CGAKMMTVGL HCRIIGKPGY 
FQSLKKFIEH ISQFEDVWVC RRIDIANHFK ETFPYSPSE