Gene CNF01520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNF01520
Symbol
ID	3258034
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006691
Strand	+
Start bp	451477
End bp	453345
Gene Length	1869 bp
Protein Length	534 aa
Translation table
GC content	56%
IMG OID	638257277
Product	UDP-N-acetylglucosamine diphosphorylase, putative
Protein accession	XP_571302
Protein GI	58268292
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4284] UDP-glucose pyrophosphorylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

AACACTCGGC CCGACCCACA ACACTGCATT CCCATCTTCT CTGCAGCTTT CTCGTCCGTC 
GTCCACTTTG CGCCCGTCCA CAGCACCATG ACCGTCCAGC CAGCACCAGA CCCTGCGCTC 
CTCGCCCACC TCAGAGACCT CTACGCCGCC GCCAACCAGG CCCATGTATT CGCATTCTAC 
GACTCGCTCT CGCCCTCCGA CCAGGCCGCC TTGCTCGGCC AGCTCGCCTC CATCGACGTC 
CACCGCGTCA ACCGTATCTA CTCCACAGCG ATCGCAGCTG CTGAAGCTCT CACGCCGTCC 
AAGGAGAACA GCAACATCTT TGGCGGCGGA CAGCCGAACC ACATCGGCGA AGGCGCGAAC 
GGTAACCTTG TAGGCAACGA GACTGTCCAG GGTTCCTTGC CCATCAAGGA GGAGGCCATG 
CCCTTGCCTG AGGAGGCATG CGCGACTGTG CTTAACAACG CTTCCGAAGA AGCTCAATGG 
CGCGACGCCG GTTTGAAGGC GATTGCCGAC AACCAGGTCG CCGTCCTCCT CATGGCCGGT 
GGACAGGGCA CCCGTCTCGG CTCTGCGCTC CCCAAGGGAC TGTACGATAT CAAGTTGCCC 
AGTGGACAGA CTTTGTTCGA ATACCAGGCC AAGAGGATCT GCAAGCTCGA GAGGCTGGCG 
GAAGAAAAGG CGGGCAAGGA GAAGGGTAGT GTCACCATTC GGTGGTACGT GATGACCAGT 
GGTCCCACCC GGGTCGAGAC GGAAAAGTAC TTCAAGGCGA AAGGCTTCTT TGGGTTGAGA 
GAAGAAAATG TCATCTTTTT TGAGCAAGGC AAGTCTTTGT GATTATCCAT CTCCTTGAAG 
CAAACAACTA ACATGCCACA GGCGTACTCC CCGCCCTTGA CAACGACGGC AAGCTTCTTC 
TTTCAACACC TAGCTCTGTA TCCGTTGCTC CCGACGGCAA CGGTGGTCTC TACGCCGCCC 
TCCGTCGCCC TCTCTCCCCC TCATCCTCCC GCACGGTCCT CTCCGATCTC CGCGAGCACA 
ATGTCCAATA CGTCCACGCC TACTGCGTCG ACAACTGCCT CGTCCGTGTT GCCGACCCCG 
TCTTCATTGG CTGCTGCTTG TCTCGCAATG CCTCGGCCGG TGCCAAGGTT GTGCGCAAGA 
CCATCCCCAC AGAGAGTGTG GGTGTCCTCG CGGCCAAGGG TAACGCTTTT GCCGTGGTGG 
AGTACTCTGA GCTGAGCAAG GAAAAGGCCG AGCAGAGGAC TGCGGACGGT CAGCTGGCTT 
TCCGTGCTGC CAACATTGCA AACCACTTTT ATACCACCGC CTTCCTCGAG TCGGTTGAAG 
AAATGGAAAA GCATATGGCG TTCCACATTG CTCGAAAGAA GATCCCCACC GTCGACCTTT 
CCACTGGCGA GCTTATCAAG CCTTCTGAGC CCAACGGCAT GAAACTTGAG CTTTTCGTCT 
TTGACGTCTT CCCATTCACC AAGAGTCTCT GTGTACTCGA AGTCGACCGT GCCGAAGAAT 
TCTCCCCGCT CAAGAATGCG CCCGGGAGCA AGGCCGACTG CCCCGAAACC AGCCGCAGGG 
ATTTGCTCGC TCAGCAAAAA AGGTGGTTGA TCGCAAGCGG TGCCGAGGTT GCCGATGATG 
TCGAGATTGA GGTCAGCCCC GAGGTCAGTT ATGCCGGTGA AGGCTTGAAC TGGATCGAGG 
GCAAAAAGTT TACCAAGAGC GGAGTGTTGA ACGGTCGGAA TGATTTAGAG AAGCTTACCG 
CGTAAAGGGA CAATTCTTTT TCTTTTCTTC TTCTTAGCAT TACGACGCAT CTGATTCAAT 
AATGGACAAT GTCTCATATG TTTGTGTCAT TTTTTTATAC ATGTCTATTA ATTTCCAATG 
CATAGAAGT

Protein sequence

MTVQPAPDPA LLAHLRDLYA AANQAHVFAF YDSLSPSDQA ALLGQLASID VHRVNRIYST 
AIAAAEALTP SKENSNIFGG GQPNHIGEGA NGNLVGNETV QGSLPIKEEA MPLPEEACAT 
VLNNASEEAQ WRDAGLKAIA DNQVAVLLMA GGQGTRLGSA LPKGLYDIKL PSGQTLFEYQ 
AKRICKLERL AEEKAGKEKG SVTIRWYVMT SGPTRVETEK YFKAKGFFGL REENVIFFEQ 
GVLPALDNDG KLLLSTPSSV SVAPDGNGGL YAALRRPLSP SSSRTVLSDL REHNVQYVHA 
YCVDNCLVRV ADPVFIGCCL SRNASAGAKV VRKTIPTESV GVLAAKGNAF AVVEYSELSK 
EKAEQRTADG QLAFRAANIA NHFYTTAFLE SVEEMEKHMA FHIARKKIPT VDLSTGELIK 
PSEPNGMKLE LFVFDVFPFT KSLCVLEVDR AEEFSPLKNA PGSKADCPET SRRDLLAQQK 
RWLIASGAEV ADDVEIEVSP EVSYAGEGLN WIEGKKFTKS GVLNGRNDLE KLTA