Gene PICST_34595 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_34595
Symbol	HUT1
ID	4851774
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	2795847
End bp	2796902
Gene Length	1056 bp
Protein Length	351 aa
Translation table
GC content	42%
IMG OID	640393482
Product	UDP-galactose transporter
Protein accession	XP_001386871
Protein GI	126275562
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.147925
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAC ACGGCCTGTT GTTGACATTG ACAATATGTG TATTAGGACT CTATGGGTCC 
TTCCTCAGTT GGTCTGTTTT GCAGGAAAGA ATCAACACAA AGCCTTATGG AGAAAACGAA 
AACGAAATTG AGTTCTTCAA GGCTCCTCTT ATCATCAATA TAGTGCAAGC GTTCTTTGCC 
TCAATAGTAG GTTTTGGCTA TTCGCTTGTG ACAACGAAAG TGAATCCGTT CAAGATATTC 
ACAGCAAACG AGAAATCAGT TGCAAGAAAG TACATGTTGT CGCTATTGTT AATTTCCATC 
ACCTCCAGCT TGTCTTCTCC CTTGGGATAC CAGTCCCTTA AACATGTAGA TTATTTGGCC 
TACTTGTTAG CCAAGTCGTG CAAGTTAATT CCTGTGATGA TCATCCATCT TGTTTTCTAT 
AGAACGAGAT TCCCTGTGTC GAAATACATC GTAGCATCGT CGGTCACTTT CGGAGTGACT 
CTCTTCACTT TGGCACATTC ATCTAAGTCT TCCAAATCAA GCATAAACGA CGGCAAAACT 
CTCCTTGGAA TGGCTCAGCT AATTGGCTCC ATGCTTTTAG ACGGTCTTAC AAATTCTACC 
CAGGACCAGA TGTTCAAGTT GCTGTCACCT AGTGGCAGCC AAAATATGGT AAAAATAACA 
GGCGCAAAGT TGATGTGTAT TCTCAACTTG TTTGTGTGCG CTTTGACGTT GGCATACACC 
GTCATATTTG CATATGAAAG TGAAGTCGTC TATACGCTTA ACTTTTTCCA CAAGCACCCA 
GAGGTGTTGT ACAATATCTT GGAGTTTTCT GTCTTTGGAG CCGTGGGCCA GGTGTTTATC 
TTCATCATCT TAGAGAAGTT TGACTCGTTA ATTCTCGTCA CAGCAACTGT TACAAGAAAG 
ATGATCAGTA TGATCCTCAG TGTCGTATTG TTTGGTCACT TCTTGTCCAG CATCCAGTGG 
TGTGGAGTTG GTCTCGTTTT TGGAGGCATA GGCTACGAAG CATTGGTCAA ATTGAACTCA 
AATAAAAAGG TCTCAAAGGA GAAAAAGAGC CAATGA

Protein sequence

MKKHGLLLTL TICVLGLYGS FLSWSVLQER INTKPYGENE NEIEFFKAPL IINIVQAFFA 
SIVGFGYSLV TTKVNPFKIF TANEKSVARK YMLSLLLISI TSSLSSPLGY QSLKHVDYLA 
YLLAKSCKLI PVMIIHLVFY RTRFPVSKYI VASSVTFGVT LFTLAHSSKS SKSSINDGKT 
LLGMAQLIGS MLLDGLTNST QDQMFKLLSP SGSQNMVKIT GAKLMCILNL FVCALTLAYT 
VIFAYESEVV YTLNFFHKHP EVLYNILEFS VFGAVGQVFI FIILEKFDSL ILVTATVTRK 
MISMILSVVL FGHFLSSIQW CGVGLVFGGI GYEALVKLNS NKKVSKEKKS Q