Gene CNC02250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNC02250
Symbol
ID	3256245
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006685
Strand	+
Start bp	637732
End bp	639384
Gene Length	1653 bp
Protein Length	481 aa
Translation table
GC content	52%
IMG OID	638255446
Product	hydroxymethylbilane synthase, putative
Protein accession	XP_569501
Protein GI	58264690
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0181] Porphobilinogen deaminase
TIGRFAM ID	[TIGR00212] porphobilinogen deaminase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CCAAACCCTC AGCCATGTCT TGCCCCTTCC ACACCACCAC AAACACCTCC AACCGCAGTC 
CCTTGCCAGA CCGTGCACTT CTCCTCGCAA TGAAGTCCCA GACAAACACT TTCATTCTCG 
GCACGCGCAA GTCAAACCTC GCCCTCGTAC AAACAGGTCA CGTCGCAGAC GATCTTCGAC 
GTCTCCATTC CGGCGCAGGC AGCAAATTCG GCGAGACTAG AGAGGAAGGT GACGATGCCG 
AACAAGGTGA TGTGCCGTTC GTGCATCCCT ACACTTTCTC CATTGAGTCT ATGACCACTG 
TTGGTGACCG AAACCAGACT ACCCCACTCC ACCTCCTCTC CCCATACTCC TCTACCCAGC 
CCGCAAAATC CCTATGGACT GATGAGCTCG AAGCTCGACT CATCAACGGT CACTTTGACA 
TGCTCGTGCA CTCCCTCAAG GATGTGCCTA CCGTTCTCAA GGACGGATGC GAAATTGGAT 
GTATGGCCAA GAGGCATGAT CCTCGCGATG CTTTGGTAGT CAAGCAGGGA TTACCGTACA 
AAAGACTGGA AGATTTGCCC GACGGAGCTG TTGTTGGTAC AGGTAGTGTG AGGAGAGTAG 
CGCAATTAAA AAGGGCTTTC CCCAATCTCG TTTTTGAGGA TATGGTAAAT TTTGTTTTTG 
CTAAAAAATA CCTTTTATGC CATGCTTACT GCCGATATGC AGCGCGGAAA CCTCAACACA 
CGATTCAACA AACTGGACAA CCCCCAATCG CCATTTTCTG CTCTTATTCT CGCCATGTCT 
GGCCTCGAAC GTTTAGGCAT GGCCCATCGT GCCACTTCGC CCCTTTCCTC TCCAACCCTC 
ATGCACGCTG TCGGCCAAGG TGCTCTTGCC ATCGAAATTC GATCCACCGA CCCTCGCGTT 
CGAAACTGTT TAAGGGGATT AGGCCACTGG CAAACTGAAT GGTCTTGCGG TGCCGAAAGA 
GGTTGCTTGA GGGTTTTGGA AGGAGGCTGC TCTGTCCCGG TCGGTGTAGA GTCTGAGCTC 
GTCGAGCTTG ACGAGGACGA GGTTGCTGCG CATCCCGAAC TACTTGAGGG TGTGGAGGAT 
CCTTTCAAGG GCCAAGAAGA GATTCCTCTT GAAGGAGACT CACCTATGCT GTGGTTCTCT 
GGTCTTGTAG ACACTACCTC CGCCCCTACT CCATCCACGC CCACTTTCTC ATCTCACTCT 
CTCCCTCCAC TTCGAACACG CCTAGCGAAG CTCACTCTCC ATTCTTGTGT CACCTCTACT 
GATGGATCCA AACATGTCCT CTTTACCCCT CCTCCTGTCC TTGTGCGATC ATACCGTCAA 
GCAGAGCAGT TCGGTGAAGA ATGTGCTCGG AGATTGAGAG GGATGGGTGC AGGGGAAATC 
TTGGATGAGA TCAACAAGCT CAGGAAGGAG CGAGAGTTGA GGGACTTGGA AAGCGCTATC 
GAGAGAAGTA GAGCGGCGCA AGAGGAGAGT GAGAAGATGG GGTTGGTTCA GGATGGCACA 
GCCGAAGTTG TTGCCTAATA AAAGCGTCTT GGATTACAAG CGGGTTTAAC GTGTATGGTT 
TATTGTTGAT TTTGTGTGTA TTATTCTCGA TTTTCACTTT TTGGGCGGGC ATGGGCTTGG 
GTTCTAGCAT ATACTCATAC ATAGTTTGGT TCT

Protein sequence

MSCPFHTTTN TSNRSPLPDR ALLLAMKSQT NTFILGTRKS NLALVQTGHV ADDLRRLHSG 
AGSKFGETRE EGDDAEQGDV PFVHPYTFSI ESMTTVGDRN QTTPLHLLSP YSSTQPAKSL 
WTDELEARLI NGHFDMLVHS LKDVPTVLKD GCEIGCMAKR HDPRDALVVK QGLPYKRLED 
LPDGAVVGTG SVRRVAQLKR AFPNLVFEDM RGNLNTRFNK LDNPQSPFSA LILAMSGLER 
LGMAHRATSP LSSPTLMHAV GQGALAIEIR STDPRVRNCL RGLGHWQTEW SCGAERGCLR 
VLEGGCSVPV GVESELVELD EDEVAAHPEL LEGVEDPFKG QEEIPLEGDS PMLWFSGLVD 
TTSAPTPSTP TFSSHSLPPL RTRLAKLTLH SCVTSTDGSK HVLFTPPPVL VRSYRQAEQF 
GEECARRLRG MGAGEILDEI NKLRKERELR DLESAIERSR AAQEESEKMG LVQDGTAEVV 
A