Gene PICST_66987 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_66987
Symbol	NBP2
ID	4837596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	1548554
End bp	1549822
Gene Length	1269 bp
Protein Length	237 aa
Translation table	12
GC content	40%
IMG OID	640388911
Product	protein that interacts with Nap1, which is involved in histone assembly
Protein accession	XP_001383070
Protein GI	126133090
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.315379
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

AACATAGAAC ACATAACAGA CACGTTTTAC AAAACAGCCG GGATATATAT CTAACTTTGG 
TTATAAGCTT TGTTTCTGTA GCTGCCAGAT TCAATAATTG TTAGAGATTC TTGAATTACA 
ATTGTAGAAT CGTCAAATTG TTAACTTGCT GTCAATTTCA CTTTTGTCAT AAAATACAAA 
AGAACAGAAG ATATCATTGA ACAACAAGAA TTGTTCTATT CACTAACAGG ATAACAAGAG 
TCTGATCCAA TTCATTCTCA TCAATCTCAA TATACTTCAG TTTGAGGAAA GCCAGATCAT 
AAAGATTGCC TCCTAGATAC AGAGACTTAT ACACACAACA CACGAGTTTC ACTGAACACT 
TCATCAAACT ACTGAACTTT GATTCTATTG ACTTATTCTA GATTCGATCT TTCATCAAGT 
CCATCAAATT TTTCATCATC GTATTTATCG TTCGCTGAAC CATGGCTGAC GAAGATCACA 
AGAATATAAG TCTATACCTT CCCAACACCG TGATAAAGGA CTACGGGTAT CCCGAGAGCC 
ATCCGTTGCA TACTGGCAAT TTTGGAGCTA TGGGCGATCC TGAGGATGTT GACGATGAAG 
ACATCAACAG TGATGACGAC TATGGCTATC TCCTTTCTGC TGCCAACAAC AATACTACAC 
ATTACCATAG TCTCGTGCGG AGCATTGACG ACGAGGATGA CGACGAAGAG ATGAACAGCA 
AACTTAATGA CGATAACGAC TATATTTATA ATGGAGACGA CGATGGCGGT CGATCCAACG 
ATGAAATCAA CTGTAGAGCC AGAGCGTTGT TCGATTTCCA GCCAGAAAAC GATAATGAAG 
TGGCATTGAC AGAGGGACAG ATAATCTGGA TTTCGTATAG ACATGGACAG GGGTGGCTCG 
TAGCAGAAGA TCCAGAGTCG GGCGAAAACG GCTTGGTTCC GGAAGAGTAT GTAGAGATCT 
TCTACACCAA GGAAGAAGTA GCTGACGATG ATGTTCCCAA ACCGTTTCTA CCTGAGCTCT 
TGCAAAATTT GGAAGAAGAC GACAGTGACG ACGCCGACTG GGTAGACACA GACTACGACG 
AAGATGAAGA TGAAGATGAG CAATCGGAGG ATGAGCACAT AAACGAAGAG GCAGACATTT 
CAGACAGATT ACACGATGTC AAGTTGGTAT CGTGACGTCG TTGTTAATAT ACACTATTGT 
AATTAGAAAC AGTATATAAT AATAGTATTA ATAGTGAAGT GAACTATCAA ACACAGCATA 
TGCTATCTG

Protein sequence

MADEDHKNIS LYLPNTVIKD YGYPESHPLH TGNFGAMGDP EDVDDEDINS DDDYGYLLSA 
ANNNTTHYHS LVRSIDDEDD DEEMNSKLND DNDYIYNGDD DGGRSNDEIN CRARALFDFQ 
PENDNEVALT EGQIIWISYR HGQGWLVAED PESGENGLVP EEYVEIFYTK EEVADDDVPK 
PFLPELLQNL EEDDSDDADW VDTDYDEDED EDEQSEDEHI NEEADISDRL HDVKLVS