Gene PICST_66703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_66703
Symbol	NUP49
ID	4851921
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	3189175
End bp	3190637
Gene Length	1463 bp
Protein Length	402 aa
Translation table
GC content	44%
IMG OID	640393629
Product	Nucleoporin NUP49/NSP49 (Nuclear pore protein NUP49/NSP49)
Protein accession	XP_001386936
Protein GI	126276026
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CTTTGGTTTA GGAAAAGAAC TCACAAGGAT AGAATATCAT CATATGTTTG GAACTGCCAA 
TAATTCACAG GCTCCAACGT CCGGTTTCGG TTTTGGTGGT GCCAATTCTA CCGGTTCAGG 
CTTCGGAGCC AAACCCAGTG GAGGTCTTTT TGGCGCCAAT CAAACAACAA ATACCGGCCC 
AGGCACTTTT GGCAGTGGAA ATGCCTTTGG AAACAATGCC AATAACCAAC AGACAGCAGG 
ATCTGGTGGC TTGTTTGGCG CTTCTGGCCA GAATCAACAG CAGCCGACAC AGAACCAGAA 
CCAACAAGGA GGAGGATTGT TTGGAAGCAA TAGCAATACG GCCGGAACTA GTAGTGGAGG 
TCTTTTCGGA AGCAAACCTG CCGCTGGTGG ATTATTTGGT GGTTCCACTG GGGCTGCTAC 
GACAGGTCTT TTTGGAGGTC AAAACCAAAC TCAAAATCCA CAAAACCAGC AAAACCAACA 
GAATACGGGA CTTTTTGGTA GTAAACCTGC TGTTGGCGGT GGATTATTTG GAGCAAGTAC 
AAGTGGACAG ACTCCTGCTG CGACCGGCGG CTTATTTGGT GGAAATACGG CTAACACGGC 
CTCTTCTACC ATGGGTGGAG GGTTATTTGG AGGATCTGCA GTAGGAAATA CACAGCAGAA 
CAAACCACTT TTTGGAGGAT TGGGCGCTTC TGGTAGCTCT GGAACAACTG GAGGTTTGTT 
CGGAGGTTCG ACTGCAAATC CTGGTGGCTT GTTCTCTCAA CAGAATCAAA ATCAACAGAA 
TCAATTTCAA CAACAACAAC AGAATCAGCA ACAAAATCAA CAGCAGTTGA CTGCAATGAC 
GAGAGTGGGC GATTTGCCTC CGGCTATAAG GCAAGAGCTC GAGGAGTTTG ATCGTTACAT 
TAACAAGCAA CATCTTGTAG CGACTACTTT ACAAGCTGAC TATGGCAAAC ACGACCAGCT 
CATCAATACT ATTCCCAAGG ATATCAATTA TCTTCATAAC AAGCTTATGT CGACAAAACA 
GGCGCTTAAA TTCGACTCTG GACAACTAGT TCATCTCAAG GAGCTCAATA ACGAAATCAC 
AGACGACATC TCAAAGATAA TGCAACTCAT ATTACAGTTA TCTACACCTG GAACACGTCT 
TTCTTCTTCT TTCCAGTTAA ATGAATTCTT TGTCAAGAAG ATCAAGAAGT ACTACGAGAT 
TTTGCGTCAG TACGAGGGAG TCGTCGCTGA ACTAGATTCA ATTCTCGGTG GCTTGGAAAG 
ACTGTGTACG GAAGGTTTTG GTAACTTGTT TAATATAGTA GAGGTTATCA AGTCGCAGTA 
CCATTTGTTC ATGGAGTTGT GTGAAACGAT GGCTCAACTT CATAATGAGG TGAACAAGTT 
GTCGAAGTAG GATCACGATG TATTATAATA AAGCAGCATA GATAGCAGTA GACTATCATA 
AAAAGTGAGA TATTCTGTTA TGG

Protein sequence

MFGTANNSQA PTSGFGFGGA NSTGSGFGAK PSGGLFGANQ TTNTGPGTFG SGNAFGNNAN 
NQQTAGSGGL FGASGQNQQQ PTQNQNQQGG GLFGSNSNTA GTSSGGLFGS KPAAGGLFGG 
STGAATTGLF GGQNQTQNPQ NQQNQQNTGL FGSKPAVGGG LFGASTSGQT PAATGGLFGG 
NTANTASSTM GGGLFGGSAN QFQQQQQNQQ QNQQQLTAMT RVGDLPPAIR QELEEFDRYI 
NKQHLVATTL QADYGKHDQL INTIPKDINY LHNKLMSTKQ ALKFDSGQLV HLKELNNEIT 
DDISKIMQLI LQLSTPGTRL SSSFQLNEFF VKKIKKYYEI LRQYEGVVAE LDSILGGLER 
LCTEGFGNLF NIVEVIKSQY HLFMELCETM AQLHNEVNKL SK