Gene PICST_42120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_42120
Symbol	MAL6
ID	4836930
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	752503
End bp	754221
Gene Length	1719 bp
Protein Length	572 aa
Translation table	12
GC content	42%
IMG OID	640388245
Product	alpha-glucosidase maltase
Protein accession	XP_001382912
Protein GI	150864188
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.217758
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.25099
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAATTG CTCGCAACTG GTGGAAAAAT GCCACTGTAT ACCAAATCTG GCCAGCTTCG 
TACAAGGACT CCAATGGAGA CGGTTTTGGT GATATCCCAG GTATCATATC AACATTGGAC 
TACCTCAAGG ATTTAGGAGT GGATGTGATT TGGTGTAGTC CCATGTACGA CTCGCCGCAG 
GATGACATGG GGTATGACAT TAGCGACTAC GAAAAGGTTT ACCCGAAGTA TGGAACTAAC 
GAAGATATGC AGGCACTTAT AGACGAAACG CATAAGCGGG GCATGAAATT GGTGTTGGAT 
TTGGTTATCA ACCATACTTC TAGCGAGCAT GCCTGGTTCA AGGAATCCAG ATCCTCGAAG 
ACCAACCCAA AAAGAGATTG GTATATTTGG AAGCCTCCTA AATTTGATGC AGATGGTAAG 
AGACATCCTC CTAATAACTG GAGTTCGTAT TTTTCTGGCT CAGCTTGGGA ATACGACGAA 
CTTACTGAAG AGTACTACTT AAGACTCTTT GCCAGAACTC AACCTGATTT GAACTGGGAA 
AACGACGAAA CCAGAAAGGC AGTCTATGAC TCTGCTATGA AGTTTTGGCT CGACAAGGGT 
ATTGATGGCT TTAGAATTGA TACAGCTGGA TTGTATTCAA AGGATCAACG CTTCCCGGAT 
TGTCCCATTG TATACCCAGA TGAAGAATTT CAGCCAAGTC AAAAGTATAG TCTGAATGGG 
CCCCGGATTC ATGAATTCCA CAAGGAAATG TACGCCAATG TAACTAGCAA CTATGATGCC 
ATGACAGTTG GAGAAGTTGG CCATTGTTCA CGAGAAGATG CCTTGAAGTA TGTCAGTGCC 
AAGGAACAAG AAATGAATAT GATATTCCTC TTCAATGCTA TTAATGTCGG TTACGATAAA 
GCTGATCGTT ACAGGTACAA GGGCTGGACC TTGACTGACT TCAAGAAGGC CATTCAAAAG 
GACTCTTCTT TCATCGAAGG CACTGATGCG TGGTCGACTG TCTTCATTGA AAACCATGAC 
ATTGCTAGAT CGGTTACTAG ATTTGGCAGT CCCAAGCACA CATCAAAGTC TGCTAAGTTG 
ATTTCCTTGT TGGAGTCCAC TTTAACAGGT ACCCTCTTCA TATACCAGGG CCAGGAAATT 
GCCATGGAAA ATTTACCAAG ATCTTGGTCT ATCGAAGAAT ACAAGGATAT CAACACTGTC 
AACTACTACA AGCAGTTCAA GGAGAAGTAT GGTAATGACC CAGACTTCAA GGAGAAGGAA 
GAGAAGTTGA TGGACATCAT CAACCTTGTT TCCAGAGACC ATGCAAGATC TCCGGTTCAA 
TGGGATTCTT CTCCCCATGG CGGTTTCACT ACAGGTACTC CGTGGACAAG AGTAAATGAT 
AATTACAAAG CCATTAATGT TGCTAGCCAG ATTGATGACC CTAACTCGGT ATTGAACTTC 
TGGAAGAAGT CTATTCAAAT AAGAAAGCAA TATCAAGACT TGCTTATTTT CGGCTCATTC 
AAAATCTTAG ATTTTGACAA CGAGACCGTC TTCACATATG TTAAGGAAGA TGAAAATGCT 
GCTTCTCCTA AGGCATATGT AGTATTGAAC TTCTCTAACG ATTCCGTGAA GTTTGAGAAG 
TTGATCGATG GCGAATTTGA ACTTGTTCAC AGCACCACTG ACGACATTGA CGAACTGACA 
TTGTCTCCAT ATGAAGGTCG TCTATATATT GTTGATTAG

Protein sequence

MTIARNWWKN ATVYQIWPAS YKDSNGDGFG DIPGIISTLD YLKDLGVDVI WCSPMYDSPQ 
DDMGYDISDY EKVYPKYGTN EDMQALIDET HKRGMKLVLD LVINHTSSEH AWFKESRSSK 
TNPKRDWYIW KPPKFDADGK RHPPNNWSSY FSGSAWEYDE LTEEYYLRLF ARTQPDLNWE 
NDETRKAVYD SAMKFWLDKG IDGFRIDTAG LYSKDQRFPD CPIVYPDEEF QPSQKYSSNG 
PRIHEFHKEM YANVTSNYDA MTVGEVGHCS REDALKYVSA KEQEMNMIFL FNAINVGYDK 
ADRYRYKGWT LTDFKKAIQK DSSFIEGTDA WSTVFIENHD IARSVTRFGS PKHTSKSAKL 
ISLLESTLTG TLFIYQGQEI AMENLPRSWS IEEYKDINTV NYYKQFKEKY GNDPDFKEKE 
EKLMDIINLV SRDHARSPVQ WDSSPHGGFT TGTPWTRVND NYKAINVASQ IDDPNSVLNF 
WKKSIQIRKQ YQDLLIFGSF KILDFDNETV FTYVKEDENA ASPKAYVVLN FSNDSVKFEK 
LIDGEFELVH STTDDIDEST LSPYEGRLYI VD