Gene PICST_81319 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_81319
Symbol	URK1
ID	4837048
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	+
Start bp	1850988
End bp	1852526
Gene Length	1539 bp
Protein Length	504 aa
Translation table	12
GC content	42%
IMG OID	640388363
Product	uridine kinase
Protein accession	XP_001382581
Protein GI	150863930
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0035] Uracil phosphoribosyltransferase [COG0572] Uridine kinase
TIGRFAM ID	[TIGR00235] uridine kinase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0146953
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.484619
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TGGACCGAAA TGACTTCGTT GGAAGAGCCT AGGCCACGTC GGTTCAGCCG AATTGCGCCA 
GACAGCGACG AGTCGACATC ATTTTTCATG TCGTCAGAAA CATTACCCAC CGAGTCTGCT 
ATCATGACTC CAGTAGGATC TTTGCATCAC GATCTGGATA CACCCAGAGC TTCTTATCTT 
CCTCCTTGGA CAGAACCGTA TATCATTGGA GTCGCAGGGA ACTCTGGATC TGGAAAAACC 
TCCATTTCGC AGAAAGTTAT CCAGGAATTG AACCAACCAT GGACGATTTT GCTTTCGTTT 
GATAACTTCT ACAATCCTTT GAACGAAGAA GAAAGAAAGC AAGCCTTCAA CAACAATTTT 
GATTTTGATA CCCCAGCCTC TTTGGATTTG GATTTGTTAG TGAAAACGGT GAAATCTTTG 
AAAAGCGGTG AGAAAACACA AATTCCGGTG TACTCGTTCC AGCACCATAA TCGTACCAAT 
AAGTCTACGA CCATCTACGG AGCCAATGTG ATCATTATTG AAGGTATTTA TGCCTTGTAT 
GACCAGAGAT TGCTTGACTT GATGGACTTG AAGATTTACG TCGACACGGA CTTGGATATC 
TGTTTGTCTC GAAGATTGAC CAGAGACATC TTGTATCGTG GTCGTGACTT GGCAGGTGCC 
ATCAAACAAT GGGAGACGTT TGTCAAACCT AACGCCGTCA AACACGTCAA CCCGACTATG 
AACAACGCCG ACTTAGTGAT TCCACGAGGC TTGGACAATC TGATTGCCAT CAACTTGATG 
ATAAAACATA TTCAGATCCA ACTAGCACTT AAAAGTTCAG CGCATTTGAA GTACTTGAAG 
GAGTTGGGTG TTAATATCAA CTTCGATGTG TCCAAATACA ACATTAAGGT TTTACCGGCA 
AATAACCAGA CGAAAGGAAT CAACTCTTTA CTCTTTGACG TCAATACTGA GAGGTCAGAT 
TTCATCTTTT ATTTTAACCG TATCAGTGCA CTTATTATAG AGTTAGCATT AGAGTTGGTT 
ACAGACTATG AGCCTGTGCG CATTAACGAC AACTTCAACG GCTTGAGAAT GGTTAACGAG 
ATCATGGCAG TTAATATTAT CCGTTCGGGA GATTGCTTTA TGTCTTCGAT CAAAAGGACT 
TTTCCAGAAA TCAGCATCGG AAAGCTTTTG ATTCAAAGTG ACTCTAGAAC TGGTGAACCA 
CAATTGCATT TTGACTCCTT GTCAAAGGAA ATGAGCGGAG GAAAGAAGAT CTTGTTGTTT 
GACTCCCAGA TCATTAGTGG AGCTGCGTCC ATCATGGCTA TCCAGGTATT AATTGACCAC 
AAGGTGAACG AAGAGGATAT CATCTTATGT TCGTATCTTT CCACAGAGAT AGGATTGCGT 
CGTATCGTTA ACGTTTTCCC CAAGGTCAAC ATTGCAGTTG GTAAATTGTC GTCTATCGAC 
GGTAGTGAAA AGAAATGGTA CAATGAGGAA ATGTTTAAGG ATAGCGACTG GCATTTTAGA 
AATAGATTTA TAGACAGTTT GTACTTTGGC ACGGACTGA

Protein sequence

MTSLEEPRPR RFSRIAPDSD ESTSFFMSSE TLPTESAIMT PVGSLHHDSD TPRASYLPPW 
TEPYIIGVAG NSGSGKTSIS QKVIQELNQP WTILLSFDNF YNPLNEEERK QAFNNNFDFD 
TPASLDLDLL VKTVKSLKSG EKTQIPVYSF QHHNRTNKST TIYGANVIII EGIYALYDQR 
LLDLMDLKIY VDTDLDICLS RRLTRDILYR GRDLAGAIKQ WETFVKPNAV KHVNPTMNNA 
DLVIPRGLDN SIAINLMIKH IQIQLALKSS AHLKYLKELG VNINFDVSKY NIKVLPANNQ 
TKGINSLLFD VNTERSDFIF YFNRISALII ELALELVTDY EPVRINDNFN GLRMVNEIMA 
VNIIRSGDCF MSSIKRTFPE ISIGKLLIQS DSRTGEPQLH FDSLSKEMSG GKKILLFDSQ 
IISGAASIMA IQVLIDHKVN EEDIILCSYL STEIGLRRIV NVFPKVNIAV GKLSEKKWYN 
EEMFKDSDWH FRNRFIDSLY FGTD