Gene PICST_37347 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_37347
Symbol	SGE1.3
ID	4851558
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	2131033
End bp	2132742
Gene Length	1710 bp
Protein Length	569 aa
Translation table
GC content	42%
IMG OID	640393266
Product	suppressor of gal11 null
Protein accession	XP_001388034
Protein GI	126274852
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.315077
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGGATA TCAAGGTACA AACGTCAAGG GTTATAGATG TAAATGATTC ACAAGTAATA 
GAGAAGCAAG CCTTGGATGA CAGGCTAGGA GATGCCCATC TCAATATTCT TCCTACAAAA 
AAAATCATAG TCTGTCTTGC AGCCTTATCG CTAGGTCTAT TTGCATCGTT CGCGGACCAG 
ACAAGTATAA CCATAGCATT ACCAGCCATA GCCAAGGATT TAAGAGCTGA AACCACTATC 
AACTGGGCGG GAACAGCCGC CTTATTGGCC AACTGTGTTT GCCAAGTTCT CTTTGGAAGA 
CTAGCAGACA TCTTTGGCAG AAAGAATATT TTGCTCTTTT CTCTTGGTAC ACAAGCAGTA 
GCAGACATTG GATGTGCAGT TTCTCGGACT GGGGTGGAAT TCTATATCTT TAGAGCGATT 
GCTGGTATTG GATGTGGAGG TACTCAATCG TTGACCATGG TGATGTTGAG CGATATTTGT 
ACCTTGAAGC AAAGGGGAAA GTATCAGGGT ATATTAGGTG CTCAGGTCGG TTTAGCGAAT 
GCTTTGGGTC CCTTCATTAT GGCAGCTTTC GTAGAACACA CAACTTGGAG AGACTTCTAC 
TACATGATGA TTCCCTTGGT TATAAGCGTG ATGGTTACCA TCTACTTTTT GATTGATGGT 
AAGAAAAATG CTAGTCAACT CAACAACGTT TTGTCCAGAA AAGAGAAATT CAAGAAGATT 
GACTACTTGG GGATGTTTTT CAGTACTGCA AGTCTTACAT TGTTGCTCAT TCCCATCAGT 
GGCGGTGGTT CATCTTACCC TTGGAACAGT CCTCTCATTA TTGGTATGTT CGTATCAGGT 
GGGTTGAGTT TCTTTGTTTT TATCTACATC GAATGGAAGC TTGCTGAACT TCCAATGATT 
CCTTTGAGAA TTTTCGCCAG TCCCTCCCTA TCTCTTATCT TGGGTTCCAA TTTCCTATAC 
GGAATGGCTT ACTACGGATT TACGTATTAC TTGCCATACT ACTTGCAAAT CGTTCGAGGA 
CTCGATTCGA TCCATGCCTC GATTATTTTG TTACCATTAG TGCTTACGCA ATCTATAGCT 
TCCATCATTG GAGGAACCTT GATAAGTTAT TTTGGCCACT ACAAGAATAT TATTCTTATG 
GGATATGGGC TCTGGACAGT TAGCTGTGGG CTCTTGTATA TCTTCAACAC GCAGACCAAC 
TGGGGAGTCA TAGTTGTCAT TTTGTTAGTT ATGGGAGTAG GCGTTGGGTG GACTTTCCAG 
CCTACAATGG TTGCTGCTCA GAGTCAAGCC AAAAAATCAG ACAGAGCGAT TGTTATCAGT 
GCCAGAAACG TTTTGAGATC CTTTGGTGGT TCAGTAGGCA TTTCTATTGC TTCCATGATT 
GTCAGCAATA GTTTGTTAAG GGAAATCAGA AGAGAATCCA AGAATGAAGG TAGCATATTG 
GACGGTTATT TGGACTACTT GAAGGATCAC ATCTACAGCA GAGTTGATAC ATCCAAGCTT 
AACCACGCCC AACAAGTGGT AGTTAGAGAG ATGTACATGA AAGCCATCAA GAACTATTTC 
TACATCTGCT TGCCTCTCAT TGCAGTTTGT TTTATCTCTA CCATCTTCGT GGTAGACCGA 
GGCTTGCAAT GTATTGACGA GGAGCCAGAA CAAAAGAACA AGGACAAGGA ATCGGATATA 
GATACAAGCA GCAACAGCTC AAGACAGTAA

Protein sequence

MEDIKVQTSR VIDVNDSQVI EKQALDDRLG DAHLNILPTK KIIVCLAALS LGLFASFADQ 
TSITIALPAI AKDLRAETTI NWAGTAALLA NCVCQVLFGR LADIFGRKNI LLFSLGTQAV 
ADIGCAVSRT GVEFYIFRAI AGIGCGGTQS LTMVMLSDIC TLKQRGKYQG ILGAQVGLAN 
ALGPFIMAAF VEHTTWRDFY YMMIPLVISV MVTIYFLIDG KKNASQLNNV LSRKEKFKKI 
DYLGMFFSTA SLTLLLIPIS GGGSSYPWNS PLIIGMFVSG GLSFFVFIYI EWKLAELPMI 
PLRIFASPSL SLILGSNFLY GMAYYGFTYY LPYYLQIVRG LDSIHASIIL LPLVLTQSIA 
SIIGGTLISY FGHYKNIILM GYGLWTVSCG LLYIFNTQTN WGVIVVILLV MGVGVGWTFQ 
PTMVAAQSQA KKSDRAIVIS ARNVLRSFGG SVGISIASMI VSNSLLREIR RESKNEGSIL 
DGYLDYLKDH IYSRVDTSKL NHAQQVVVRE MYMKAIKNYF YICLPLIAVC FISTIFVVDR 
GLQCIDEEPE QKNKDKESDI DTSSNSSRQ