Gene PICST_39517 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_39517
Symbol	XUT7
ID	4851701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	2586586
End bp	2587836
Gene Length	1251 bp
Protein Length	417 aa
Translation table
GC content	44%
IMG OID	640393409
Product	xylose transporter, high affinity, putative similarity to STL13
Protein accession	XP_001387067
Protein GI	126275308
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000189877
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.584414
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ACTTTTGCAG TTAACTTGTA TGTGTTTGCA GTTGGTAGAG TGCTTTCTGG GGTGGGTGTA 
GGAGTTCTAT CGACTATGGT GCCGTCCTAT CAATGCGAAA TTAGTCCCAG CGAAGAAAGA 
GGCAAGTTGG TGTGTGGAGA GTTCACGGGA AATATCACTG GTTATGCTCT CAGTGTATGG 
GCCGATTACT TCTGCTACTT TATTCAAGAT ATAGGTGATG CAAGGGAGAA GCCTCATAGC 
TTCTTTGCCC ACTTGTCCTG GCGATTGCCT CTATTCATCC AGGTGGTGAT AGCGGCTGTT 
CTCTTTGTTG GGGGATTTTT TATTGTCGAG TCACCTCGTT GGTTATTAGA TGTAGACCAG 
GACCAACAAG GATTCCATGT ATTAGCGTTG CTCTATGATT CACATCTAGA TGATAACAAA 
CCACGTGAAG AGTTCTTTAT GATCAAAAAC TCCATCTTGT TAGAAAGAGA AACTACACCT 
AAGAGCGAAC GAACTTGGAA ACATATGTTC AAGAACTACA TGACCCGAGT GCTTATAGCT 
TGTTCAGCAC TTGGCTTTGC ACAGTTCAAC GGCATAAATA TCATTTCGTA CTATGCCCCC 
ATGGTATTTG AAGAAGCAGG CTTCAACAAC TCCAAGGCTT TACTTATGAC AGGCATCAAC 
TCTATAGTAT ATTGGTTCAG TACGATTCCT CCGTGGTTTC TCGTGGATCA TTGGGGTAGA 
AAGCCAATTT TGATATCCGG GGGTTTATCT ATGGGAATAT GTATTGGTTT GATTGCGGTG 
GTAATTCTAC TAGACAAGTC GTTCACACCG TCTATGGTTG CGGTATTGGT GATAATCTAC 
AATGCATCTT TTGGCTACAG TTGGGGTCCT ATCGGATTCT TGATCCCGCC GGAGGTGATG 
CCATTGGCAG TTAGATCGAA AGGTGTTTCT ATTTCTACGG CTACAAACTG GTTTGCCAAT 
TTTGTTGTGG GTCAGATGAC GCCAATTCTA CAGCAGAGAT TGGGCTGGGG AACTTATCTA 
TTCCCGGCTG GTAGTTGTAT CATCTCGGTG ATAGTGGTGA TTTTCTTCTA TCCAGAGACA 
AAGGGTGCAG AGCTAGAGGA TATGGACTCT GTGTTCGAGA GCTTTTACAA CTACAAGTCT 
CCGTTCAAGA TTTCACGAAA GAGACACCAG AATGATGGCC AGGCGTACCA AAGGGTAGAG 
AACGATATCC GCCACAACGA TGTAGAAATG GACGATTTGG ACGATTTGGA C

Protein sequence

TFAVNLYVFA VGRVLSGVGV GVLSTMVPSY QCEISPSEER GKLVCGEFTG NITGYALSVW 
ADYFCYFIQD IGDAREKPHS FFAHLSWRLP LFIQVVIAAV LFVGGFFIVE SPRWLLDVDQ 
DQQGFHVLAL LYDSHLDDNK PREEFFMIKN SILLERETTP KSERTWKHMF KNYMTRVLIA 
CSALGFAQFN GINIISYYAP MVFEEAGFNN SKALLMTGIN SIVYWFSTIP PWFLVDHWGR 
KPILISGGLS MGICIGLIAV VILLDKSFTP SMVAVLVIIY NASFGYSWGP IGFLIPPEVM 
PLAVRSKGVS ISTATNWFAN FVVGQMTPIL QQRLGWGTYL FPAGSCIISV IVVIFFYPET 
KGAELEDMDS VFESFYNYKS PFKISRKRHQ NDGQAYQRVE NDIRHNDVEM DDLDDLD