Gene PICST_44044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_44044
Symbol	SGE1.1
ID	4837958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	675801
End bp	677120
Gene Length	1320 bp
Protein Length	440 aa
Translation table	12
GC content	42%
IMG OID	640389273
Product	suppressor of gal11 null
Protein accession	XP_001383765
Protein GI	150864791
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.333138
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATAG CTGGACTAAC AGACCAGTCG CAGACTTTGG ATAGAAAGAA GCTCTTATTG 
ACATTATCTT GTTTGACAGC TTCTTTGTTC GTGTCTTTCT TTGACCAGAC TGCTGTCTCC 
ACGGCTATCC CTTCCATTTC GAAGGATCTT CACCATGCGT TTCTCATTAA TAGTTGGACA 
TCGACTTCGT ACTTGATAGC TAACACAAAT TTCCAATTGC TTTATGGTCG ATTTTCGGAC 
ATCTTTGGAA GAAAACAAAT ATTTGTCTTC AGTTTGGTTT GTCTCATGGT AGGTGACTTA 
GGCTGTGGAT TCGCCAAAAA CCCAACCATG CTTTTCATCT TCAGAGGCTT GTCGGGTATA 
GGTGGAGGAG GTGTAAATTG CTTGGTGATG ATCACATTTT CTGATTTGCT TTCCCCTCGA 
CAAAGAGGAA AATATTTTGG AATAGTAGCT GCAGCCACCT CTGCTGGTAA TGGCATTGGA 
CCATTCATTG GAGGATTGTT GTCAGAACAC GCTTCCTGGA GGTGGGCTTT TTGGTTAAGT 
TGTCCCATTT GCTTGGTTTG TGGTCTCTTG TTGATATTAT TTGTGCCCTT GAAACCAGTC 
GAAGGCTCTT TCAAAAAGAA AATCAAGTTG ATCGATTGGT TTGGTTTCAT TACGAGCATG 
ATCTTCTCTG TGTTGTTTCT TGTGGCAATT TCTGGTGGAA ATGAGTCGTG GCCCTGGAAG 
TCAGCAACAT TTATCTCGCT CATAATAATC AGCTCCATCG CCTTTTTCTG TTTCATTGGC 
GTTGAACAAT ACTATGCTGA AATCCCCTTG ATCCCTTTGC GTCTCTTCAC AGACTTACAA 
AGATTCTTAT TATTTTTGCT GTGTTTCTCG ATGGGATTGG CATATTTTGT GGATATATAT 
TATTTGCCCT TGTACTTGCA AAACTACAGA GGCTGGCAAC CTATGATAGC TGGTGTCATC 
CAGTTACCTG CGACTTGCAC AAGTAGTATT TTTGGAGTTG TGGTAGGACA AATCAATAGT 
AGAACTGGCA GGTACGTTCA ATGTTTATGG GCTGGTGGTG CATTATGGGC TCTTGGAAGT 
GGGTTGAAAT TGATGTACGA TTCAAACACC TCAATTGGCT ACATTGTGGG AACCAACATT 
ATCCAAGGTT GTGGCATTGG CTTTACTTTT CAACCAACAT TACTTGCCCT TTTGGCTAAT 
TCAGATTCAG CAGACCGTGC TGTTGTTACA GGGTTACGGA ACTTCTTCAG GTGCTTTGGA 
GGCTCCGTTG GTCTCGTTAT CAGTGGAATT GCCTTCAATG CTACTCTTAG AAGCCAACTA

Protein sequence

MTIAGLTDQS QTLDRKKLLL TLSCLTASLF VSFFDQTAVS TAIPSISKDL HHAFLINSWT 
STSYLIANTN FQLLYGRFSD IFGRKQIFVF SLVCLMVGDL GCGFAKNPTM LFIFRGLSGI 
GGGGVNCLVM ITFSDLLSPR QRGKYFGIVA AATSAGNGIG PFIGGLLSEH ASWRWAFWLS 
CPICLVCGLL LILFVPLKPV EGSFKKKIKL IDWFGFITSM IFSVLFLVAI SGGNESWPWK 
SATFISLIII SSIAFFCFIG VEQYYAEIPL IPLRLFTDLQ RFLLFLSCFS MGLAYFVDIY 
YLPLYLQNYR GWQPMIAGVI QLPATCTSSI FGVVVGQINS RTGRYVQCLW AGGALWALGS 
GLKLMYDSNT SIGYIVGTNI IQGCGIGFTF QPTLLALLAN SDSADRAVVT GLRNFFRCFG 
GSVGLVISGI AFNATLRSQL