Gene PICST_33008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33008
Symbol	XUT1
ID	4839826
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	+
Start bp	1207231
End bp	1208931
Gene Length	1701 bp
Protein Length	566 aa
Translation table	12
GC content	43%
IMG OID	640391141
Product	sugar transporter, high affinity, putative
Protein accession	XP_001385583
Protein GI	126138120
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00879] MFS transporter, sugar porter (SP) family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.348655
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGGTG GTGGTGACGG TAACGATATC ACAGAAATTA TTGCAGCCAG ACGTCTCCAG 
ATCGCTGGTA AGTCTGGTGT GGCTGGTTTA GTCGCAAACT CAAGATCTTT CTTCATCGCA 
GTCTTTGCAT CTCTTGGTGG ATTGGTCTAC GGTTACAATC AAGGTATGTT CGGTCAAATT 
TCCGGTATGT ACTCATTCTC CAAAGCTATT GGTGTTGAAA AGATTCAAGA CAATCCTACT 
TTGCAAGGTT TGTTGACTTC TATTCTTGAA CTTGGTGCCT GGGTTGGTGT CTTGATGAAC 
GGTTACATTG CTGATAGATT GGGTCGTAAG AAGTCAGTTG TTGTCGGTGT TTTCTTCTTC 
TTCATCGGTG TCATTGTACA AGCTGTTGCT CGTGGTGGTA ACTACGACTA CATCTTAGGT 
GGTAGATTTG TCGTCGGTAT TGGTGTGGGT ATTCTTTCTA TGGTTGTGCC ATTGTACAAT 
GCTGAAGTTT CTCCACCAGA AATTCGTGGT TCTTTGGTTG CTTTGCAACA ATTGGCTATT 
ACTTTCGGTA TTATGATTTC TTACTGGATT ACCTACGGTA CCAACTACAT TGGTGGTACT 
GGCTCTGGTC AAAGTAAAGC TTCTTGGTTG GTTCCTATTT GTATCCAATT GGTTCCAGCT 
TTGCTCTTGG GTGTTGGTAT CTTCTTCATG CCTGAGTCTC CAAGATGGTT GATGAACGAA 
GACAGAGAAG ACGAATGTTT GTCCGTTCTT TCCAACTTGC GTTCCTTGAG TAAGGAAGAT 
ACTCTTGTTC AAATGGAATT CCTTGAAATG AAGGCACAAA AGTTGTTCGA AAGAGAACTT 
TCTGCAAAGT ACTTCCCTCA CCTCCAAGAC GGTTCTGCCA AGAGCAACTT CTTGATTGGT 
TTCAACCAAT ACAAGTCCAT GATTACTCAC TACCCAACCT TCAAGCGTGT TGCAGTTGCC 
TGTTTAATTA TGACCTTCCA ACAATGGACT GGTGTTAACT TCATCTTGTA CTATGCTCCA 
TTCATCTTCA GTTCTTTAGG TTTGTCTGGA AACACCATTT CTCTTTTAGC TTCTGGTGTT 
GTCGGTATCG TCATGTTCCT TGCTACCATT CCAGCTGTTC TTTGGGTCGA CAGACTTGGT 
AGAAAGCCAG TTTTGATTTC CGGTGCCATT ATCATGGGTA TTTGTCACTT TGTTGTGGCT 
GCAATCTTAG GTCAGTTCGG TGGTAACTTT GTCAACCACT CCGGTGCTGG TTGGGTTGCT 
GTTGTCTTCG TTTGGATTTT CGCTATCGGT TTCGGTTACT CTTGGGGTCC ATGTGCTTGG 
GTCCTTGTTG CCGAAGTCTT CCCATTGGGT TTGCGTGCTA AGGGTGTTTC TATCGGTGCC 
TCTTCTAACT GGTTGAACAA CTTCGCTGTC GCCATGTCTA CCCCAGATTT TGTTGCTAAG 
GCTAAGTTCG GTGCTTACAT TTTCTTAGGT TTGATGTGTA TTTTCGGTGC CGCATACGTT 
CAATTCTTCT GTCCAGAAAC TAAGGGTCGT ACCTTGGAAG AAATTGATGA ACTTTTCGGT 
GACACCTCTG GTACTTCCAA GATGGAAAAG GAAATCCATG AGCAAAAGCT TAAGGAAGTT 
GGTTTGCTTC AATTGCTCGG TGAAGAAAAT GCTTCTGAAT CCGAAAACAG CAAGGCTGAT 
GTCTACCACG TTGAAAAATA A

Protein sequence

MHGGGDGNDI TEIIAARRLQ IAGKSGVAGL VANSRSFFIA VFASLGGLVY GYNQGMFGQI 
SGMYSFSKAI GVEKIQDNPT LQGLLTSILE LGAWVGVLMN GYIADRLGRK KSVVVGVFFF 
FIGVIVQAVA RGGNYDYILG GRFVVGIGVG ILSMVVPLYN AEVSPPEIRG SLVALQQLAI 
TFGIMISYWI TYGTNYIGGT GSGQSKASWL VPICIQLVPA LLLGVGIFFM PESPRWLMNE 
DREDECLSVL SNLRSLSKED TLVQMEFLEM KAQKLFEREL SAKYFPHLQD GSAKSNFLIG 
FNQYKSMITH YPTFKRVAVA CLIMTFQQWT GVNFILYYAP FIFSSLGLSG NTISLLASGV 
VGIVMFLATI PAVLWVDRLG RKPVLISGAI IMGICHFVVA AILGQFGGNF VNHSGAGWVA 
VVFVWIFAIG FGYSWGPCAW VLVAEVFPLG LRAKGVSIGA SSNWLNNFAV AMSTPDFVAK 
AKFGAYIFLG LMCIFGAAYV QFFCPETKGR TLEEIDELFG DTSGTSKMEK EIHEQKLKEV 
GLLQLLGEEN ASESENSKAD VYHVEK