Gene CNB01020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNB01020
Symbol
ID	3255859
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006684
Strand	-
Start bp	307153
End bp	309293
Gene Length	2141 bp
Protein Length	472 aa
Translation table
GC content	49%
IMG OID	638254753
Product	mandelate racemase/muconate lactonizing enzyme, putative
Protein accession	XP_569108
Protein GI	58263396
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.629016
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CCCGTTTCTT CCATCCCCAC TATTGCTCCA CAAATAACCA TGTCAGGCCT CAAGATCACA 
GAATTCTCCG TCCACGGTAT GTCATGCACT GCCCTCTCAT GACCACTGGC TAATCATTCG 
CATCAGATAT CCGATTTCCC ACCGTAAGCC TGACCTTTTT CTTTTTTTCA ACCACCAAGC 
AGCAGCTCAC CTCGTATCAA GAATGTCACT GGTGACGGTA CGGATGCCAT GTAAGCCATT 
TCAGTCCAGT CCATAAAGCC CATACTGACA GCACCGCAGG AACAAGGAGT GCGATTATTC 
CGCTGCCTAC ATCGTCGTCA AGACGAACTC TGACCTCAAG GGGCAAGGAA TGACTTTTAG 
TATGTAAAAA CATCCTATTG CCTGCATAGG AATATTTTCT GACTGTTCTG CAGCCATTGG 
TCGTGGAAAC GAAATCGTCT GCTTTGCTAT CGAACAAATA GCTAACCGTA TCGTCGGTTT 
GGACCTTGCC CCCATCTTTG CCGACATGGG CAAGTTCTGG GACTTTTGTA AGCCATCGTT 
TTCCAACAGG AAAATAGAAA CCAGTCGGCT AACATCTTTT AAAGTGGTGG CCGACCCTCA 
GCACCGTTGG CTCGGCCCTG AAAAGGGTGT CATCCATATT GCTACCGCCG CTATTTCCAA 
TGCCATCTGG GATATGTACG CCAAGCACGC CGGCAAGCCC TTGTGGAAGC TCATTGTCGA 
CTTTACTCCT GAAGAGTATG TCCTGCTGTA CTTTTCACCT TGGATAAAAT AAGCTAACCG 
TCAGACAGAT TCGTAAAGGC CACCTCTTTC CGATACATCA CCGACGCCCT CTCCCCGGCC 
GAAGCCCTTG AGATCCTCAA GTCCAAGGAG TCTGGAAAGG CTGCCAGGGA AGCCGACGTC 
AAAAAGAGGG GATACCCTGC CTACACCACC TCTGTCGGAT GGCTCGGGTA CTCTGACGAA 
AAGGTCAGGC GATTGACAAA GGAAAGCCTT GCCCAAGGCT TCAACCATTT CAAGGTCAGT 
GTCGACTTGA GAGAGACGGA TACGATCGCC CATTTTAACA TCTCTTAAAC CTCTTTAGCT 
CAAAGTCGGC GCCGACCCCG AAGACGATCT TCGAAGGGGA CGACTCATCA GGTCCATCAT 
CGATGATCCC GCCAACATGC CTAAAGATAG AAAACCTATC GACCCTGCCT CCATCGCCAA 
CAAGAACGCC GGCCCCACAG GCTGTGTACT GATGGTGGAC GCCAACCGTG AGTCACTATA 
AACCGGAAAC CTGCCGCAGA GCTAACTAAT CCCTTTATCA GAGGTCTGGG ATGTCCCTCA 
GGCCGTTGAG TACATGAAGA AGCTTGAACC CTTGAAGCCT TGGTTCATTG AAGAGCCTAC 
TGCCCCCGAT GATGCAGTCG GTCACGCCGC CATTCGAAAG GCCCTTAAAC CCATCAATAT 
CGGCGTCGCC ACAGGTGAAC ACGCTCATAA CCGAGTGAGT TAAAAAACTT TTGAACCCAC 
CCTCGTAACA ATCCACTAAA ACCGACATAT GACAGATGGT CTTCAAGCAA CTGTTGCAGC 
TTGACGCTAT TGACGTTTGT CAAATCGACT CTTGTCGACT GGGCGGTGTC AATGAGATTC 
TCTCTGTTTT GCTCATGTCT GCCAAATTCG GGGTACCAGT CTGCCCTCAC GCCGGTGGTG 
TAGGATTGTG CGAGTATGTG GTGAGTATAT TCAGCTTCTA TAAAGCGACA AAAAAAGAAA 
CTGATCAAAG AGTAACTCTC CAGATCCACT TGTCTCTCAT TGACTACATT TGCGTCTCTG 
GTGATATGGA GCGTAACGTC TTGGAATTTG TAGAGTAAGT GGCCCATTCT ACTCCTTGAT 
ACAATTGCCC TTCGCTTACC CCCTTTCACA TAGCCATCTG CATGAGCACT TCCTCTACCC 
CGTGTCCATC AACTCTGAAG GTCGATACAA TGTACCTACC GATGCCAAGG GCGGATACTC 
TATCGAGATG TTTGAAAAGT CAATGGAGGA CTACGCCTTC CCTGGAGGTG CTTACTGGGC 
CGCGGTGGCA AGGGGAGAGA ACCCTGCCGT TTCACATTAA TCATATCTGG TTAGAGTATT 
ATCATTGTAC GATAATGTAG ATCTGTACGC ATGAACCGAG T

Protein sequence

MSGLKITEFS VHDIRFPTNV TGDGTDAMNK ECDYSAAYIV VKTNSDLKGQ GMTFTIGRGN 
EIVCFAIEQI ANRIVGLDLA PIFADMGKFW DFLVADPQHR WLGPEKGVIH IATAAISNAI 
WDMYAKHAGK PLWKLIVDFT PEEFVKATSF RYITDALSPA EALEILKSKE SGKAAREADV 
KKRGYPAYTT SVGWLGYSDE KVRRLTKESL AQGFNHFKLK VGADPEDDLR RGRLIRSIID 
DPANMPKDRK PIDPASIANK NAGPTGCVLM VDANQVWDVP QAVEYMKKLE PLKPWFIEEP 
TAPDDAVGHA AIRKALKPIN IGVATGEHAH NRMVFKQLLQ LDAIDVCQID SCRLGGVNEI 
LSVLLMSAKF GVPVCPHAGG VGLCEYVIHL SLIDYICVSG DMERNVLEFV DHLHEHFLYP 
VSINSEGRYN VPTDAKGGYS IEMFEKSMED YAFPGGAYWA AVARGENPAV SH