Gene CNL06640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNL06640
Symbol
ID	3255027
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006681
Strand	+
Start bp	848237
End bp	849683
Gene Length	1447 bp
Protein Length	376 aa
Translation table
GC content	48%
IMG OID	638254141
Product	phospho-2-dehydro-3-deoxyheptonate aldolase, putative
Protein accession	XP_568187
Protein GI	58261554
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0587923
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGACTTTACA TTTATTACAT CTGCATATTC AGAACCTCTA TTCGAGAAAT GCCCTCCCCT 
ACAAGAGTAT CTATCCGAGA CGTAAGTCAT TCTGTTGCTT GATTTTTGAT TGGCAAAAAG 
CTCATTTGAA GACAGGCCAT GGAACTCCTC GACGACCGAA GGGTCAAGAT TGTCAGGCCT 
CTTATCCCGT ACGTCTCTGA TCAATGTATT CGTTTGGAAG CTTATGCTCC CTCAGCCCTC 
AGATTTTACA TGAAGAGCTT CCCCTCTCAT TGAGAGGCGC CCAAACTGTG CTTGACGGCC 
GTCGACAAGT TGAGGCTGTC ATCAAAGGCG ATGATGACCG ATTGCTTGTC GTTGTCGGCC 
CCTGTTCCGT GCACGATCCC GAACAGGCCA TCACCTATGC CAAAGCTCTC AAAGAGTACG 
CCGACAAGGC TGCTGAAGAT CTTGTGATTG TTATGCGAGT CTACTTTGAA AAGTATGTCT 
ATCCAATATG GAAAAAGCAA GTATTATTGA GCTGACATTC AGGTAGACCT CGAACAACTG 
TTGGCTGGAA GGGATTGATC AACGACCCGG ACATGAATGG TTCTTACCAA ATTAACCGAG 
GTCTTAAGAT TGCACGAAAG TTGCTGTTGG ACATTACCGA AATTGGTTTG CCCGCTGCCG 
GCGAGTTCCT TGGTTTGTCT TCACCATCTC TTCCCTTGTT TGAACTCCCA AGCTTACAGC 
TTCACAGATG TCATTTCTCC CCAGTACCTC GCCGACCTTT TCGCATGGGG CGCCATCGGA 
GCCCGAACCA CGGAATCCCA AGTCCACCGA GAACTCGCGT CTGCACTCTC CATGTCCGTC 
GGTTTCAAGA ACGGTACTGA CGGCTCTATC GGGATTGCAA TTGATGCGAT CAAAGCAGCC 
GGATCTGGAC ACACTTTCTT GTCTGTTACC AAGCAAGGAT TGTCCGCGAT TGTTGAGACG 
GAAGGAAACA GTTCTACACA TGTCATCTTG AGAGGAAGCA GCAAGGGACC TAATTATGGA 
GCGGATGATG TGGCCGCTTG TGCGGAAAAA TTGAACAAAA GCGGATTGCC TGCCAAGCTT 
ATGGTACGTT TATTAATCGT CTCTTCTGGT TTAAAAATAC ATGGCTAAAA CAAGCAAACA 
GATTGACTGC TCTCATGGTA ACTCCTCCAA ACAACACCTC AACCAAATTA AGGTCGGTGC 
CGACATTGCC TCCCAACTTT CCTCTGGACC CACATCCAAC GCCATTGTCG GTGTCATGAT 
TGAGTCCAAC ATCTTTGAAG GTCGACAAAA TGTTCCTGCC GAGGGACCTT CTGGATTGAA 
GTACGGTATC TCTGTGACGG ATGCTTGTAT TTCGATGGAG CAGACTATTC CTTTGTTGGA 
TGAGTTGAGG AAGGGTGTGC AAGCGAGGAG AGAAGCTGTC AAGGCTAAGA GAGAGGGACA 
GCAGTAA

Protein sequence

MPSPTRVSIR DAMELLDDRR VKIVRPLIPP QILHEELPLS LRGAQTVLDG RRQVEAVIKG 
DDDRLLVVVG PCSVHDPEQA ITYAKALKEY ADKAAEDLVI VMRVYFEKPR TTVGWKGLIN 
DPDMNGSYQI NRGLKIARKL LLDITEIGLP AAGEFLDVIS PQYLADLFAW GAIGARTTES 
QVHRELASAL SMSVGFKNGT DGSIGIAIDA IKAAGSGHTF LSVTKQGLSA IVETEGNSST 
HVILRGSSKG PNYGADDVAA CAEKLNKSGL PAKLMIDCSH GNSSKQHLNQ IKVGADIASQ 
LSSGPTSNAI VGVMIESNIF EGRQNVPAEG PSGLKYGISV TDACISMEQT IPLLDELRKG 
VQARREAVKA KREGQQ