Gene PICST_31020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31020
Symbol	NUP2
ID	4837863
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	1539031
End bp	1540239
Gene Length	1209 bp
Protein Length	402 aa
Translation table	12
GC content	44%
IMG OID	640389178
Product	purine nucleoside permease
Protein accession	XP_001383913
Protein GI	150864907
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG5042] Purine nucleoside permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.171142
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.23144
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATTT TCAAATTTTT TGCAATCGTT ATCGCAACTT CTGCAGTTGC AGCGCAACCA 
GTTTTCGTCT CCAAGAGAGA AGTCACCGTA GGAGAAACAA AAGAGTTGCC TCTGTCGACC 
GACAATGACC TCCATCTGAG CTACGGTAAG CCCTATGCTA TTTTCCAGCC AAAGGTGTTT 
ATCGTTTCTA TGTTTGAGTT GGAAAGAGAT CCTTGGCTAG AAGCGTTGGA CTTTGTTCAC 
AACATTTCGC TTCCGGGCTT GTCGCCCATA TACTCTACTA TCTACTGTAC TACTAACTAC 
AGTATCTGTC AGGCTACTGC TGGAGAAGGC GAGATCAATG CCGCTTCGTC GTTGACTGCT 
TTGACTTTGA GTCCCTTGTT TGATCTCACC AAGACCTATT GGTTGTTGGC GGGTATTTCT 
GGCGGAGAAC CTACTCAGGT TACTACAGGA TCAGCTACAT TTGCGAAATA CGCCATTCAG 
GTCGGGTTGC AATATCAAAT AGACTACCGT GAGTATATAA ACACGAATCC AGATTGGATT 
AGCGGCTACA TTCCTTACGG AACCGATAAC CCGTATACTT ATCCAGGCAA TGTCTACGGA 
ACTGAAGTTT TCGAGCTTAA CGAAAAGTTG AGAAATAGAG CACTTGAGTT AGCCTCTAAC 
GTCCAATTGG ATAACGGAAC TGAAAAAAAT GCCGAGTTTA GAGCTCTCTA CGAAGTTGAA 
CCCGCAATTA GCCCCCCTAC AGTGGTAGGC TGTGATGTCT TGACCTCGGA CAACTACTTC 
ACAGGAAATG TCTTAAACGA CTACTTTGCA AACCTCACGA AGCTTATGAC TAACGGTAGC 
GCTACCTATT GTTCTACAGC ACAAGAGGAC AATGCTTCGC TAGAAGTTTT CACAAGAATG 
CAGAAATACG GCTTAGTCGA CTACGAGAGA ATTGTAGTAT TGAGAACTAT CTCCAACTTT 
TCCAGGCCGC CGCCTTCTAT GGCCAATAAT ACAGTGAAAT TTTTCACCGA TACCGACAAA 
GGCGGAATTG GTCATTCTCT TGCAAACTTG GTCAACGCTG GTTTTCCATT TATTCACGAT 
GTTCTCACCA ACTGGGAAAA CGTATACGAG AGTGGAGAAA CCTACGAGGC TGACAACTAC 
GTAGGCGACA TCTTCGGGAG TGTAGGTGGA AAGCCAGACT TTGGTAAAGA TAGTTTCGAA 
ATAGCTTAG

Protein sequence

MKIFKFFAIV IATSAVAAQP VFVSKREVTV GETKELPSST DNDLHSSYGK PYAIFQPKVF 
IVSMFELERD PWLEALDFVH NISLPGLSPI YSTIYCTTNY SICQATAGEG EINAASSLTA 
LTLSPLFDLT KTYWLLAGIS GGEPTQVTTG SATFAKYAIQ VGLQYQIDYR EYINTNPDWI 
SGYIPYGTDN PYTYPGNVYG TEVFELNEKL RNRALELASN VQLDNGTEKN AEFRALYEVE 
PAISPPTVVG CDVLTSDNYF TGNVLNDYFA NLTKLMTNGS ATYCSTAQED NASLEVFTRM 
QKYGLVDYER IVVLRTISNF SRPPPSMANN TVKFFTDTDK GGIGHSLANL VNAGFPFIHD 
VLTNWENVYE SGETYEADNY VGDIFGSVGG KPDFGKDSFE IA