Gene CNG00100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNG00100
Symbol
ID	3258805
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006692
Strand	+
Start bp	21364
End bp	23073
Gene Length	1710 bp
Protein Length	392 aa
Translation table
GC content	49%
IMG OID	638257622
Product	L-arabinitol 4-dehydrogenase, putative
Protein accession	XP_571725
Protein GI	58269138
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.603371
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CAACAATGAC CATTGCGGCT ACATCTATCC CTACCACCAA GTACGAGGCG CACTACGACC 
CCACAAAGGT CATTCAGCAT CCCGAGTTCC AAACGCTCAG TGAAGATGCT CCTGAGCTTT 
CCGACCCCAA GCTCAACATC GCCTGTGCGT ACAACCCGGC TCATGAGATC CACATGGTCA 
AGAAGCCTCG ATTCGAGCCC GGTCCTGGTG AAGTGACAAT CCACGTCCGT GCCACAGGAA 
TCTGCGGGTA CGTTGTTCCT TCCTCCTCCC ATATCAAATC GGAACTATTT AAGAAGTTTA 
ATGTTTGATG TAGTTCTGAC GTTCACTTCT GGAAACACGG CCATATTGGA CCTACCATGA 
TTGTCACAGA TGAGTGCGGA GCAGGTCATG AATCGGCAGG CGAAATCGTT GCCGTTGGAG 
AAGGCGTCGC ACAATGGCAG GTCGGTGACA GGGTAGCTGT TGAAGCCGGT GTTCCATGCG 
GTCTCGCCTC ATGTGACCCT TGTCGTACCG GTCGTTACAA CGCTTGTCAG TATTCTAAGT 
ATTCTTTCGA GGTTTGTCCC ACTGGAGGTG TTTATGTTTT TTGTCTAGGT CCTGCTGTCG 
TCTTCTTCTC CACCCCTCCT TACCATGGTA CACTCACTCG ATATCACAAT CACCCGGCTG 
CTTGGTGCCA CCGTCTCGCC GATAACGTGT CTTATGAAGA AGGATCCCTG TGTGAGCCTC 
TTGCAGTGGC GCTGGCCGGT CTTGACAGGG CTGGTGTGAG ATTGGGGGAC CCTATTGCCA 
TTTGGTAAGT ATACTCCCAC CTTGATATCT TCGTTTTCAA GTGCAGCGTT GACCATTGAT 
AGCGGGGCGG GCCCTATAGG GTTAGTTACT CTTCTTGCTG CGCATGCTGC AGGTTGTACG 
CCCATTGTCA TCACCGATCT CTTCCCATCC CGACTTGAGT TCGCCAAGAA GCTTCTTCCA 
ACTGTCAAGA CTGTACAGAT TGAGAAGACT GCAAAGCCCG AAGAGGTTGC GAAGCAGATC 
AAGGGCGCGG CGGGTATGCA GCTTTCGCTT GCATTTGACT GTACAGGAGT GGAGAGCAGT 
ATCAGATCTG CTATCTTCGT AAGTCCTTGC TTGAAAGACA TCTTCACAGT TTCTAACACT 
AACTCTATTG CTTTGACAGT CTGTCAAGTT TGGAGGCAAA GTCTTTGTAA TTGGTGTCGG 
ACCTTCAGAG CAAAGCGTGA GTCTTTTCCT TACTTCTATT CCCGCCATGA ATAGTCAACA 
GCTAATACTA TCTTTGTCAG TACCCATTCG GCTATTGTAG CGCCAACGAG ATCGATCTCC 
AATTCCAGTA CAGGTACAAC AATCAAGTCA GTAATTTCCG CATACCTTAT CAAGCTCCCT 
AGAAAAGCCT TGCTGATGTA AGCCTAAAAA CTCCTGCAGT ACCCGAAAGC CATTCGACTC 
GTCGCTGGCG GGCTTGTCGA CCTGAAACCA CTTGTCACCC ACCGTTTCGC TTTGAAGGAG 
GCTGTTAAGG CTTTCCACGT CGCCGCTGAT CCCTCTCAAG GAGCTATCAA GGTTCAGATC 
CGTGATTAGT CGGATTAGTC AGTGGATTTT TCGTGATGGT AAAAAGGTGT GATCTTGGCT 
TGTTAGATAA TTAAACAGTC TTAGAGTTAG GTATACAGTA TAGATATCAT GGAGTTCTTC 
CTGAGATTCC AGATGCCATG ATCATGAAAT

Protein sequence

MTIAATSIPT TKYEAHYDPT KVIQHPEFQT LSEDAPELSD PKLNIACAYN PAHEIHMVKK 
PRFEPGPGEV TIHVRATGIC GSDVHFWKHG HIGPTMIVTD ECGAGHESAG EIVAVGEGVA 
QWQVGDRVAV EAGVPCGLAS CDPCRTGRYN ACPAVVFFST PPYHGTLTRY HNHPAAWCHR 
LADNVSYEEG SLCEPLAVAL AGLDRAGVRL GDPIAICGAG PIGLVTLLAA HAAGCTPIVI 
TDLFPSRLEF AKKLLPTVKT VQIEKTAKPE EVAKQIKGAA GMQLSLAFDC TGVESSIRSA 
IFSVKFGGKV FVIGVGPSEQ SYPFGYCSAN EIDLQFQYRY NNQYPKAIRL VAGGLVDLKP 
LVTHRFALKE AVKAFHVAAD PSQGAIKVQI RD