Gene CNK02940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNK02940
Symbol
ID	3254501
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006680
Strand	+
Start bp	862222
End bp	863495
Gene Length	1274 bp
Protein Length	367 aa
Translation table
GC content	52%
IMG OID	638253785
Product	alcohol dehydrogenase (NADP+), putative
Protein accession	XP_567889
Protein GI	58260958
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.013941
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTGCCG ACAACGAATT CAAAGGCTGG GCTGGTTTGG ACGAGAAGGC CTGCGACGGC 
CACATGTCAT TCCAGGAGTT CACTCCCAAG AAGTGGGATG AAGACGACGT CGATGGTGAG 
TATCGTCTGC TGGAGTAATG GAAGCCGACG GAGCTGACAT GTCAACAGTC AAAATTTTGT 
ACTGCGGTAT CTGTGGTTCA GATGTCTCCT CTTTAACTGG TGAATGGGGA CCTGTAAAGG 
ACATCTGCCC CCAGGTTTGC GGCCACGAAA TCGTTGGTGA GGTTGTGAGG GTCGGCACCT 
CTCCCGAAAA CGGCCTTAAG ATTGGTGACC TCGTCGGTAT TGGTGCCCAG TCAGACTCTT 
GTCGTGAATG CGAATGGTGC AAGGAAGGTC AGTAATCTCT ATTACAATCC AACTTGCAAC 
AAGTACTGAC ATGTAGATGC TAGGCAAGGA AAACTACTGT GCTACCCAAA CCATCACTTT 
TAACTACCCC TACAACCGTG GTCCCAATGG CAAGGGGTCC ATCGCCCGAG GTGGTTTTGC 
CAAGTACTGG CGAGGACCTT CCAAGTTTGC TGTCCCGCTT CCTTCCGGCC TCGAGCCTGA 
CGTTGCGGCA CCTATGCTTT GTGGTGGTGT CACCGTCTAC AGCCCCCTCG CCCGTTTTGA 
AATCGGTACC AAGCGCAAGC GCGTCGGTGT CATCGGTGTC GGTGGTCTCG GTCACATGGC 
TATCCTTTTT GCCAAGGCTA TGGGCGCCGA GGTGACTGCT ATCTCTCGAA CTGATGCGAA 
GAAGGAGGAC GCCTTCAAGC TTGGTGCTAC CGATTACTTT GCTACTGGTG GTGACTTGCA 
GGAGGCTGTC AAGGCTCGCA CTCGATCTCT CGACTTTATT CTCTGTACTA TCAGTAAGTC 
ATCATCGTCA ATGGACTTCT ACCCCAACTT GTATGCTGAT TCTTGTACTA TCAGACCCTG 
AAAGCTTCTC CATCAGCGAC TACCTCCCCC TCCTCACCCC CGCCGGTGTC TTCTGCATCG 
TCGGCGTCAT CCCCACCCCT TTGCAAGTCC CCGCTTTCCC TCTTATCATG AACAGCGCTT 
GCGTCGCCGG TTCCAACATC GGTAGCCCCA AGGAGATTAC TGAAATGTTC GAATTCGCCG 
TTAAGCACAA CATTAAGCCT TGGATCCAGA AGTGGAACTT CGACGATATC AACAAGGCGT 
TGCCTTCTTT CCAAAAAGGT GATCCTAGGT ATAGGTTCGT CTTGGTCAAC GCCGATAATG 
GCGGCAAGCT TTAA

Protein sequence

MVADNEFKGW AGLDEKACDG HMSFQEFTPK KWDEDDVDVK ILYCGICGSD VSSLTGEWGP 
VKDICPQVCG HEIVGEVVRV GTSPENGLKI GDLVGIGAQS DSCRECEWCK EGKENYCATQ 
TITFNYPYNR GPNGKGSIAR GGFAKYWRGP SKFAVPLPSG LEPDVAAPML CGGVTVYSPL 
ARFEIGTKRK RVGVIGVGGL GHMAILFAKA MGAEVTAISR TDAKKEDAFK LGATDYFATG 
GDLQEAVKAR TRSLDFILCT INPESFSISD YLPLLTPAGV FCIVGVIPTP LQVPAFPLIM 
NSACVAGSNI GSPKEITEMF EFAVKHNIKP WIQKWNFDDI NKALPSFQKG DPRYRFVLVN 
ADNGGKL