Gene CNC06850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNC06850
Symbol
ID	3256764
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006685
Strand	-
Start bp	2002112
End bp	2003622
Gene Length	1511 bp
Protein Length	361 aa
Translation table
GC content	49%
IMG OID	638255905
Product	conserved hypothetical protein
Protein accession	XP_569928
Protein GI	58265544
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0423295
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGCCG CCTTTTCCAA CAAGCTCAAA TACGCTGTCC TCGGTGCTGG CCGTATGGGC 
CAGCGTCATG CTCTCAACGT TGCCTTCAGA TCTCCCCGTG CAGAACTGGT AGCAGTAGCC 
GACCCCAAAC CTTCTATTCC TCAATGGATG AAGGACAACT TGCCTCCGAG TACCAAGTAC 
TTCGAGAACT ACGAAGACTG TCTCGTGAAC AGTGGAGCAG ATGCTGTTCT AATTGCGAGT 
GCGACAAGCT GGCACGCTCC CATGGCTATT GATGCTATGC ATGCTGGCAA GGTGAGTTCA 
TTAATGTGAA CTGTGCTGTT CTATGCTGAC TTCTCATTAG CATGTCTTAC TGGAGAAGCC 
TATTTCCATC GATCTCGAAA CCTCCAGGAG TGTCGTTGCG GAGGCTGAAA AATTCCCAGA 
CTTGAAGGTC ATGATTGGCT TCAGTCGCCG ATGTAAGTCC GAACCGGTTC CCCTACCAAG 
AGAAGCCCTG CTAAACATAT CATTTTGAAG TTGACGAGTC TTACCGACAG GCGAGGAAGA 
TGATTGAAAA CGGACAACTA GGCAAGGCCC ACTTGATCAA GTCTGCTACC AACGATCAGT 
ATGACCCGTC CGGATTTTTC GTCTCCTATG CAGCCGCTTC CGGTGGCATT TACATTGACT 
GTGGTATCCA CGACATTGAT TGCGCCCGAT GGCTCCTTGA CGCCTCTCTT GGTATTCCCA 
ACCCCAAAAA ACAAGTCCGC CGTGTATTTG CTGCGGGCCA CAACATCCGG CACCCCGAGC 
TTGTCCAGGA CAACGATGTC GACAACGCAG TAGGGTTTGT GGAGTTTGAA AATGGCAAAA 
TGCTGGTGTT ACACCTGAGC AGGACTTCTA TGCATGGTCA CGATTGCTTT GCTGAGGTTT 
TCGGAACGGA CGGAAAGGTA ATCGTTAACG GAGTGAGTTG TCATAGGTTA ATCCGGATGC 
GGTGGAGGCT GACGCGATGT TGCAGAACCC TCAGCTTAAC CGAGTGGAGA TTCGCGATGT 
TCACGGTGTC CGTAGCGAGT CGACGTGAGT AGTTTTATCA GATATCTGGT GGCAGAGGAG 
ATAATCCGCT TACATATAAT TAGCCCTACC TATTACGAGC GTTTCAAGGA TGCTTTTGTG 
ACAGAGATCA ACGAGTTTAC TTCCGCCGTC CTCGATAACA AACGTACGTG CTTCACCTAG 
TCTTGTCTGA TATCTATTAA CTCGATACTT CCCATAGCTC TCCCAGTTAA CGCCATCGAT 
GCTCTTGAGG CAAGCAAGAT TGCGACCGCT TTGACACACT CCTTCAAAAC CAATACTCCG 
GTCTTCTTCG ATGACGAGGG CGAGCCGATA TTGGCGTAAT TGTGAAAGAA GACGGCGTTC 
GTTTGGGGTT ATAAAAAGTG TGGGGACCGT GCAATTATAC AATGCAATTA GGAAGATAAT 
TTGAATAGAC TAAGAAATAG AGAAAAAGGT AGACGCAAGG AAAGAAAGAA ATGCAAAATA 
GATAGCGAGT C

Protein sequence

MSAAFSNKLK YAVLGAGRMG QRHALNVAFR SPRAELVAVA DPKPSIPQWM KDNLPPSTKY 
FENYEDCLVN SGADAVLIAS ATSWHAPMAI DAMHAGKHVL LEKPISIDLE TSRSVVAEAE 
KFPDLKVMIG FSRRFDESYR QARKMIENGQ LGKAHLIKSA TNDQYDPSGF FVSYAAASGG 
IYIDCGIHDI DCARWLLDAS LGIPNPKKQV RRVFAAGHNI RHPELVQDND VDNAVGFVEF 
ENGKMLVLHL SRTSMHGHDC FAEVFGTDGK VIVNGNPQLN RVEIRDVHGV RSESTPTYYE 
RFKDAFVTEI NEFTSAVLDN KPLPVNAIDA LEASKIATAL THSFKTNTPV FFDDEGEPIL 
A