Gene PICST_49451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_49451
Symbol	PUR7
ID	4840515
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009047
Strand	-
Start bp	1091703
End bp	1092623
Gene Length	921 bp
Protein Length	306 aa
Translation table	12
GC content	41%
IMG OID	640391830
Product	Phosphoribosylaminoimidazole-succinocarboxamide synthase (SAICAR synthetase)
Protein accession	XP_001386402
Protein GI	126139759
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0152] Phosphoribosylaminoimidazolesuccinocarboxamide (SAICAR) synthase
TIGRFAM ID	[TIGR00081] phosphoribosylaminoimidazole-succinocarboxamide synthase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.471375
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTTGC ACACTACAGA ATTAGACAAC ATCTTGCCTT TGGTTACCAG GGGTAAAGTC 
AGAGATATCT ACCAAGTGGA TGAAAACACT TTATTGTTTG TAGCTACAGA CAGAATCTCT 
GCTTATGATG TGATAATGGA TAATGCTGTT CCTGAGAAGG GGAAGCTCTT GACCAAGTTG 
TCTGAATTCT GGTTCGAGTT TTTGTCGCAG ACTATACCTA ACCATCTTAT CCTATCTAAG 
AACGATGACG AAAGTTTGTT TGCTAAATTG CCAGCTCAAT TGTCTGAAGC AAAGTATAAA 
TTGCAATTGT CAGGTAGATC GTTGTTGGTG AGAAAGTTGA AGTTGATTCC ACTAGAAGTG 
ATTGTCAGAG GTTACATAAC GGGCTCTGCT TGGAAGGAGT ACAAGAAGAC TCAGACTGTT 
CATGGTTTGT CAGTTGAAGC TGGCTTGTTG GAATCACAAG AATTTGCAAC TCCAATTTTC 
ACTCCATCGA CCAAAGCTGA TCAAGGTGAA CATGATGAAA ACATTTCCCC AGAAAAGGCT 
GCTGAGATTG TTGGCCAAGA ATTGTGTGAT AAATTAGCCA AAGCTGCTAT CGAATTGTAC 
ACGAAGGCTA AGGAGTACGC AAAGACTAGA GGCATCATCA TAGCTGATAC CAAGTTCGAA 
TTCGGTTTGG ATACTGACCA CAATTTGGTT TTGGTTGATG AAGTTTTGAC TCCAGATTCT 
TCCAGATTCT GGAATGCTTC TGCCTACAAA TTAGGCAAAT CTCAAGAATC TTATGACAAG 
CAATTTTTGA GAGACTGGTT AACTTCGAAC GGCATTGCTG GCAAGGACGG AGTTAAGATG 
GACGAAGATA TTGTCGCAAG GACCAGAGCC AAGTACATCG AAGCATACGA AGCTATCACT 
GGCGACAAAT GGACCTCTTA A

Protein sequence

MSLHTTELDN ILPLVTRGKV RDIYQVDENT LLFVATDRIS AYDVIMDNAV PEKGKLLTKL 
SEFWFEFLSQ TIPNHLILSK NDDESLFAKL PAQLSEAKYK LQLSGRSLLV RKLKLIPLEV 
IVRGYITGSA WKEYKKTQTV HGLSVEAGLL ESQEFATPIF TPSTKADQGE HDENISPEKA 
AEIVGQELCD KLAKAAIELY TKAKEYAKTR GIIIADTKFE FGLDTDHNLV LVDEVLTPDS 
SRFWNASAYK LGKSQESYDK QFLRDWLTSN GIAGKDGVKM DEDIVARTRA KYIEAYEAIT 
GDKWTS