Gene PICST_79520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_79520
Symbol	PNU1
ID	4840548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009047
Strand	-
Start bp	920602
End bp	921668
Gene Length	1067 bp
Protein Length	325 aa
Translation table	12
GC content	47%
IMG OID	640391863
Product	Mitochondrial nuclease
Protein accession	XP_001386365
Protein GI	126139685
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1864] DNA/RNA endonuclease G, NUC1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.553306
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CAAGATGAGT AAAGTTCTTG TTAATACCTT GGGATTAGGA ACTGTGGGCG TGGCCTCGTT 
TTTCTGGGGC CGTTCTTCAA CTCCAGCTGA TGTTGCTACT GAAAGCAAAA CAGATTCCAA 
GAATCTTCCA GCAATAGTAA ATGGAGGCAA CGGGGCTCCA GACAAGGCAT TATTCAATCC 
TGAACTTGTG AAGCCAAGTC AGTTCTTCAA ATACGGCTTT CCTGGCCCTA TTCACGATTT 
ACAAAACAGA AGTGAATTTG TCAGTTGCTA CAATAGACAG ACTAGAAACC CATACTGGGT 
CGTAGAGCAT ATTACCAAGG AGTCAGTGCA AAGGGGCAGC GGAGTAGACC GGAAGAATTC 
CGTCTTCAAG GAAGATGAAG CTATTCCGGC CAAGTTCAGA AGCAGATTGA GAGACTTCTT 
CAGAAGTGGC TACGATAGGG GACACCAGGC TCCAGCAGCT GACGCTAAGT TCAGCCAAGT 
TGCTATGGAT GAAACGTTCT ACTTGACCAA CATGTCTCCA CAGGTGGGCG ATGGATTCAA 
CAGAGACTAC TGGGCACACT TCGAAGACTT TGCACGTAGA TTGACTAACA GATACGACAA 
TGTGCGTATA ATGACGGGGC CATTATTCTT GCCAAAGAGA TGTGACGACG GAAAGTACAG 
AGTCACCTAC GAGGTTATTG GGTCTCCGCC AAATGTTGCC GTACCGACCC ACTTCTTCAA 
GTTGATTGTG GGGGAGAACA ACGGTGACGA CCGGATCAGT GTCGGAGCCT TTGTGTTACC 
CAACGAGCGC ATCGATAACA CCGACGACTT GACCAAATAC CAGGTGCCCG TGGAAGCCTT 
GGAGAGATCT ACAGGACTAG AGTTGTTGCA GAAGGTTCCT TTCAGCAAGA AGAAGGACTT 
GTGTCGCGAG GTCAAGTGCG AGATACTAGT GCGAGAGTTC CCAAAGCAAG CCAAGAATGT 
GTTGGCCTTG CCCGGTAAAT AGATTGCTAC GACACATGCT AGAAACACAT GCGACATGGC 
TAATACATAC TAAATAGCTA CACATACACA TACTTCGTAA GAGCAAA

Protein sequence

MSKVLVNTLG LGTVGVASFF WGRSSTPADV ATESKTDSKN LPAIVNGGNG APDKALFNPE 
LVKPSQFFKY GFPGPIHDLQ NRSEFVSCYN RQTRNPYWVV EHITKESVQR GSGVDRKNSV 
FKEDEAIPAK FRSRLRDFFR SGYDRGHQAP AADAKFSQVA MDETFYLTNM SPQVGDGFNR 
DYWAHFEDFA RRLTNRYDNV RIMTGPLFLP KRCDDGKYRV TYEVIGSPPN VAVPTHFFKL 
IVGENNGDDR ISVGAFVLPN ERIDNTDDLT KYQVPVEALE RSTGLELLQK VPFSKKKDLC 
REVKCEILVR EFPKQAKNVL ALPGK