Gene PICST_33726 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33726
Symbol	SGA1
ID	4840861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	+
Start bp	337269
End bp	338951
Gene Length	1683 bp
Protein Length	560 aa
Translation table	12
GC content	38%
IMG OID	640392176
Product	Glucoamylase GLU1 precursor (Glucan 1,4-alpha-glucosidase) (1,4-alpha-D-glucan glucohydrolase)
Protein accession	XP_001386458
Protein GI	150866757
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3387] Glucoamylase and related glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.259511
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTGC AATTACTATT GTTATTACAG TTTGTTAGCT TCTGCTACAG TTTGTACATC 
CCAATTGGAG GACAATCTTT CAATAGAGGT CTCATCGAAA TTGAAAAAAG CATAGGTGAT 
GCTACCGACG GCTCATTCCT TCCTGGTTTT ATTCAGCAGT TCTTCAGTTG GTCAGTTTCG 
GAGAAGGTAG AAGATAACAT CCGCCTTGTT GATTTTGAGA CATGGATTGA GAAGCAGAAG 
GAAATTTCAT TCAGAGGTAT CCTTAATAAT ATCGGGGGTG TCAGTGATAC TCTCGAACAA 
TCTGAAGTTT CCAAAGGCGC TGTAATCGCT TCTCCATCGA GAATTCAGCC AAATTACTTT 
TACCAGTGGG TGAGAGACGC TGCTTTAACC ATTAAGTCAC TTGTTTATCA CATTGATGAT 
AACAATTTTG AAAATGTCGA CGATATCCAA TCAGTTATCG AAGCGTACAT AGAGAACAAC 
TATTATTTGC AACGTTTAGA TAACAACTCT GGAAAGTTTG ATGACCCAGA TAAGTCTGGC 
CTTGGAGAAC CAAAGTTCCA TGCAAACAAT ACGGCTTTCG TCCAAAACTG GGGTAGACCT 
CAGAGAGATG GGCCAGGTTT AAGAGCTATC ACTATTTTGA GTTATGTGAG CTTGTTGGAC 
AAGTGGAACA AGAAAGTTTC CAACAAGTTT TTGAAGTCTC CAGAATTTAT CTATAACAAA 
ATCGTGAAGC CTGACTTAAC TTACATTGTC AGAAATTGGT TCAAAGAGGG ATTTGATTTA 
TGGGAAGAAA TAAATTCGCA TCACTTTTAC ACGTCTGTCA CACAACTAGC TGCAATCAAG 
GATGGTTTAT TATTGGCCCA GAAGTTTGAA AAAGATTCCG ATTTTTTGAG ACAATTGCAA 
ATCACTTATA CAAACTTGAA GCAATTTATA GAGAATGATT CTGGTTACAA GAACCCTGCT 
GTACCGTATA TCGTTGAAAC TCCACTGTTA CTTAGAGCAG GTAAACGTAC TGGCTTGGAT 
GCTGGATCAC TCTTGGGTTC TCTTCATTCT CATAACATGG AATTTGGAGA CTATAGTGAC 
ATTCCGTTTG ATGTTAATGA TACCCATTTG ATCAACACTT TGAGTGCAAT GGTCGCAGAT 
ATGAAGTACA GATATCCTCT CAATCATAAC AAGATTGGGT TTGAAAAGGG CATTGGATGT 
GCCTTGGGAA GATATCCTGA AGATATTTAT GATGGATATG GTACTTCTGA AGGTAACCCA 
TGGTTTATTT CAACTGCTTC TGCTTCTGAA CTAATTTACA AGTTTATATA CAACTTAGAG 
CATAACCACA TGGATATTGT GATTAACAGT CAGAACAAAG ATTTCTTCAA ACAGTTTGTT 
GACTTTGATA ATATCCCATC AAATGACTTG ACAACAGTAC CTGCCAATGA TTATACTGAT 
TCAATTGTGA TTAGATATGG AACCCAAACA TTCAGAACAC TCTCAATTAA TTTGGTGACA 
TATTCTGATT CCTTTTTGGA AGTGATCAAA GATCACGTTG ATAATCAGGG CCGCATGTCG 
GAGCAATTCA ATAAGTATCA TGGTTTCATG CAAGGTGCAA GGGATTTGAC TTGGAGTTAT 
AGTGCAGTTT GGAATGCCTT CAGATGGAGA CAGAAGACTT TAGATATTTT AGACCAATTC 
TAG

Protein sequence

MKLQLLLLLQ FVSFCYSLYI PIGGQSFNRG LIEIEKSIGD ATDGSFLPGF IQQFFSWSVS 
EKVEDNIRLV DFETWIEKQK EISFRGILNN IGGVSDTLEQ SEVSKGAVIA SPSRIQPNYF 
YQWVRDAALT IKSLVYHIDD NNFENVDDIQ SVIEAYIENN YYLQRLDNNS GKFDDPDKSG 
LGEPKFHANN TAFVQNWGRP QRDGPGLRAI TILSYVSLLD KWNKKVSNKF LKSPEFIYNK 
IVKPDLTYIV RNWFKEGFDL WEEINSHHFY TSVTQLAAIK DGLLLAQKFE KDSDFLRQLQ 
ITYTNLKQFI ENDSGYKNPA VPYIVETPSL LRAGKRTGLD AGSLLGSLHS HNMEFGDYSD 
IPFDVNDTHL INTLSAMVAD MKYRYPLNHN KIGFEKGIGC ALGRYPEDIY DGYGTSEGNP 
WFISTASASE LIYKFIYNLE HNHMDIVINS QNKDFFKQFV DFDNIPSNDL TTVPANDYTD 
SIVIRYGTQT FRTLSINLVT YSDSFLEVIK DHVDNQGRMS EQFNKYHGFM QGARDLTWSY 
SAVWNAFRWR QKTLDILDQF