Gene PICST_29844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_29844
Symbol
ID	4837295
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	+
Start bp	1321321
End bp	1322943
Gene Length	1623 bp
Protein Length	540 aa
Translation table	12
GC content	39%
IMG OID	640388610
Product	predicted protein
Protein accession	XP_001382475
Protein GI	150863856
COG category	[R] General function prediction only
COG ID	[COG2270] Permeases of the major facilitator superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.300774
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.114506
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACAGC TGAAAAAGTT GAAAGATCCC ACAATTGAGG AGGTAGGATA TTCTTCTACC 
AGTGTTGATG AACAGGACAA TGATTCTCCA TGGGCAAAGA AAAGTATTTA TAGAGCTTGG 
TTGTTGTTAT GTTACTCCAC AGGTCCAGTA GCTTCTATGT CTAGGACATA TGTTCCAGCA 
GTTATTCAAT CTATTGCTAC CGAAGTTGGA AGAAATAGTA AAGGTGGTAG ATGTGAAAGA 
AGAGGAAATG ATTGTTACAT TGATTTCGGT GTCGGAAAGG TACACTCCAC TTCTTTTGTT 
CTCTACCTTA AAGCCATTTA CACCTCTCTT GAGGGATTGA TATCGATTTT TCTAATGGGC 
ATTGCTGATT ACTCGAACTA CAGAAAAATC CTCTTGATAG GTTCAATTAC TTTATTTGGT 
ATTTTTGCAC TTCCGTTTGC AGCCTTCACG GGAAAGAATT ATTCAACCCT AAAAACTATC 
TCAGTATTCT ATGCTCTAAT GAGTGTAATT GATTCCGTCT ACCAGATATT AGAGGGGTCT 
TATATTCCTC TTTTTATGAG GGCAGTGCCT AAAAAGCAGG ATGAAGTTGA AGAAGCTAGA 
AACACCAGGG TTTTGCAAAG GGGATCTGTT GTGAGCGTCA TGGGATTATT CTTGGGAAAT 
TGCGGTGGAC TTACAGCTCT ACTTATTGGC ATAATTATAT CTTATGGAAG AGGAGGTCCA 
ATGGAAGATG GTTATCACAA TTTCTTGCTT GCAATTACTA TAGCAGGTTG CGTTACAGTT 
GTCTTCTCTA TTATAAGTGC CTTCTATATC CCCAGTGTGA AAGGAAAACC TAAACCAGAA 
GGCGAAATTT TGTTGTTCTT AACTGCAAGA AGATTTGTAA CGCTTTTGAA GAACATCCAG 
AAGTATCCGA ATGCTTTCCT CTATTGTGTC TCCTGGGTCA TTTGGAATGT CAGCTTTAGT 
AACTTCATGA GTGTATTCGT GTTGCTCTTT AGATCAACTC TAGGAATCGG CAATTCGGAT 
TCAGAGTACA CTGTTTACAC ATTTATGTCG TATATTACTG CTTCATTGGG CTCGATTGCT 
TGGATGCTTC TTTATCCACA ATGCGGAATC AAAATCAAGA CTTGGGGATA TGGATTTCTT 
ATTTTTTCAG CTTTTACTAA CTTTTGGGGG TGTTTGGGAA TTAGAAAGTC TATTTCCATT 
GGCTTTAAGA ACAGATGGGA GTTTTGGTTA TTTGAAGTAT TTTATTCAGG ATCGAGTTCT 
GCAATGAGGT CTTTGAATAG AACCGTCTAT AGTTCACTTT TACCAGAAGG AGACGAGGCT 
CAATATTTTG GTCTTGAAAT AATGTTAGGT GTAGCCACAG GATGGATTGG TTCATTGGTT 
AATGCAGCCA TCCAGGACAG GACTAACAAC GACAGATTTC CCTTCTTGCC AAATTGTATT 
TTGGTTCTTA TCTCACTTGT TTTGTATTCC CTAACTGATA CCGAGCAAGG CATGAGAGAT 
GCTAAAAAAT TGGTAGAAGA CTCTATTCAA ATTAGAGATG ATCAGGCACT TGACCAAACA 
GAAGGTTTGT CTGCTTCTTT CGACCACAAC GAGGAAAACT CTAACAAGTC TCTTTGTAAA 
TGA

Protein sequence

MEQSKKLKDP TIEEVGYSST SVDEQDNDSP WAKKSIYRAW LLLCYSTGPV ASMSRTYVPA 
VIQSIATEVG RNSKGGRCER RGNDCYIDFG VGKVHSTSFV LYLKAIYTSL EGLISIFLMG 
IADYSNYRKI LLIGSITLFG IFALPFAAFT GKNYSTLKTI SVFYALMSVI DSVYQILEGS 
YIPLFMRAVP KKQDEVEEAR NTRVLQRGSV VSVMGLFLGN CGGLTALLIG IIISYGRGGP 
MEDGYHNFLL AITIAGCVTV VFSIISAFYI PSVKGKPKPE GEILLFLTAR RFVTLLKNIQ 
KYPNAFLYCV SWVIWNVSFS NFMSVFVLLF RSTLGIGNSD SEYTVYTFMS YITASLGSIA 
WMLLYPQCGI KIKTWGYGFL IFSAFTNFWG CLGIRKSISI GFKNRWEFWL FEVFYSGSSS 
AMRSLNRTVY SSLLPEGDEA QYFGLEIMLG VATGWIGSLV NAAIQDRTNN DRFPFLPNCI 
LVLISLVLYS LTDTEQGMRD AKKLVEDSIQ IRDDQALDQT EGLSASFDHN EENSNKSLCK