Gene PICST_29041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_29041
Symbol	HXT2.1
ID	4851777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	2801503
End bp	2802984
Gene Length	1482 bp
Protein Length	493 aa
Translation table
GC content	40%
IMG OID	640393485
Product	hexose transporter (tentative)
Protein accession	XP_001386873
Protein GI	126275571
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00879] MFS transporter, sugar porter (SP) family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.773835
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCATA TTTTTGTGTT TTTATGTACT CTTTCTTGTA CTACTAACGG TTACGATGGT 
TCTATGTTGA ACGGTTTGCA AGCACTTGAC TCCTGGCAGG ATGCAATGGG TCACCCAGAA 
GGCTATAAGC TTGGTTCCCT TGCAAATGGT ACAATCTTTG GTTCAGTTCT CAGTGTTTCT 
GTTGCAGCAT GGCTCAGTGA CAAGGTCGGT AGAAGAGTCG CTATTATTAT TGGTTCTGGT 
ATAGCCGTTG TTGGTGCTAT TTTACAAGGT GCTTCTACTA ATTTCGCTTT CTTTTTAGTT 
TCCAGAATTT TGCTTGGTTT CGGTGTTGGA ATTGGAGCTA TTGCTTCACC CGCATTGATT 
GCAGAAATTT CTTACCCAAC TTTCAGACCA ACGTGTACTA CCCTCTACAA TACGTTATGG 
TATTTGGGTG CTGTTATTGC TGCTTGGGTC ACTTTCGGTA CTCAACACTT GAAAGGAAGT 
GCTAGTTGGA GAGTTCCATC GTATATCCAG GCATTCTTAC CAGCAGTGCA ATTTGTCAGT 
CTTTGGTGGT GCCCCGAATC CCCAAGATGG ATGATTGCCA AAGGCAGAGA AGATGAAGCC 
AGACAAATCC TCTTCAAATA TCATACTGGT GGGGACCAAG ATGATAGAGC AGTAAGATTG 
GTTGAGTTTG AAATAAAAGA AATCAAGGCT GCTTTGGAGA TGGAAAAGAT TTGCTCCAAC 
TCTAAGTACA GTGACTTCTT GACAATTCCT TCTTACAGAA AGAGATTATT TTTGCTTTCA 
TTTACAGCTA TCATCATGCA ATTATCTGGT AATGGGTTAG TTTCTTACTA TCTCAGTAAG 
GTTTTGACTT CAATTGGTAT TAAATCTGCT AACGAGCAGT TGATCATCAA TGGTTGTCTT 
ATGATTTACA ATATGGTTAT TGCTCTGTCT GTTGCATTCG TCGTTTACTT ATTTAGAAGA 
AGAACTTTGT TCTTAACGTC CATTTCAGGT ATGTTATTCA GTTACATTAT CTGGACAGCC 
CTTTCTGCAG TTAATCAACA GAGAGACTTC AAGGACAAAT CATTGGGCAA GGGCGTGCTT 
GCAATGATCT TCTTCTACTA TTTGTCCTAC GATATTGGTG CAAATGGATT GCCATTCTTG 
TATGTGACAG AAATCTTACC TTACACCCAC AGAGCCAAGG GCCTTAACGT CATGTACGGG 
GTTCAAATGA CTACTTTAGT GTACAATGGT TACGTCAACC CTATAGCTAT GGACGCACTT 
GACTGGAAAT ACTACATTGT GTGGTGTTGT TTCTTGGCCT TTGAATTGCT CATTGTCTAC 
TTCTTCTTTG TGGAAACATA TGGATACTCT TTGGAAGAAG TTGCAAAGGT TTTCGGTGAC 
GATCCAAACT CTTCCCTCAT TCAATCAACT TCTAGCAACG AAAAAGCTTC CATTGAGCAT 
TTAGAAGATA CTTCTTCCGC AGAGATCGGA AGAGTCGTCT GA

Protein sequence

MLHIFVFLCT LSCTTNGYDG SMLNGLQALD SWQDAMGHPE GYKLGSLANG TIFGSVLSVS 
VAAWLSDKVG RRVAIIIGSG IAVVGAILQG ASTNFAFFLV SRILLGFGVG IGAIASPALI 
AEISYPTFRP TCTTLYNTLW YLGAVIAAWV TFGTQHLKGS ASWRVPSYIQ AFLPAVQFVS 
LWWCPESPRW MIAKGREDEA RQILFKYHTG GDQDDRAVRL VEFEIKEIKA ALEMEKICSN 
SKYSDFLTIP SYRKRLFLLS FTAIIMQLSG NGLVSYYLSK VLTSIGIKSA NEQLIINGCL 
MIYNMVIALS VAFVVYLFRR RTLFLTSISG MLFSYIIWTA LSAVNQQRDF KDKSLGKGVL 
AMIFFYYLSY DIGANGLPFL YVTEILPYTH RAKGLNVMYG VQMTTLVYNG YVNPIAMDAL 
DWKYYIVWCC FLAFELLIVY FFFVETYGYS LEEVAKVFGD DPNSSLIQST SSNEKASIEH 
LEDTSSAEIG RVV