Gene CNC04170 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNC04170
Symbol
ID	3256544
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006685
Strand	+
Start bp	1273965
End bp	1275213
Gene Length	1249 bp
Protein Length	251 aa
Translation table
GC content	50%
IMG OID	638255638
Product	conserved hypothetical protein
Protein accession	XP_569663
Protein GI	58265014
COG category	[R] General function prediction only
COG ID	[COG0637] Predicted phosphatase/phosphohexomutase
TIGRFAM ID	[TIGR01509] haloacid dehalogenase superfamily, subfamily IA, variant 3 with third motif having DD or ED

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGCCC TACTCGCACA GCGTGTCCTG CCTCAAATCG AGTATGCCAT CTTCGACATG 
GATGGTCTTC TTAGTACGTG ATCCCATGCT CACAGTCATG TCCTCTCGCT CATCAATTTG 
TGTGAACAGT GTAAGCTGCT TGATTCGCTG TCAAAACGCC GCTCGTCATA GCATACTGAC 
CACTGATACG TTTGTTTGAT TCTAGTGACT CCGAGGTTCG TTCGCTCAAC AACATTCCTG 
TTGGGTTCCA TTTACTGACT TGCTTACGTC CCAGAGGATC TACACAGAGG TGACCAGTAC 
GACGCAATCC GCTTTTGACG TAGAAGATTA ACTAATAAAG TTCTCAAAGA TGCCATTCTC 
GGTCGCTATG GTCATACAAT GACCTGGGAC ATCAAAGCCG GTGTTATGGG CAAACCCCAA 
CGTATCGCTG CAGAGTACAT TCTCTCGCAT TTCCCCGACA TTCTGGAGAA ACTGACCGTC 
GAAGAATTCA TCGCCGAGGG TGTGCAGAGG AGAGAAGAAC TCTTCAAGCG GGTTGAGCCT 
ATGAGAGGAG CTGCAGAATT GGTCAAAGGT TTGGTGAGTA CTGAAGCAGC ACTAGGCATA 
GACACGGGGG GCTAAATATG AATAAAAGCA TGCCGCTGGA ATCCCTATCG CCCTGGCTAC 
GGGCTCTACC ATGCCAAATT TCATTCATAA AACAGTGAGC TAGACACTTT ATCGACTGCG 
CAATCCCACG CTTATACCGG ACGGTTGCAG ACACATCTTC CCCACATCTT CTCTCTTTTC 
CCGCCGACGT CAATTCTCAC TGCAGACTCT CCCGAAGTCA AGCGTGGTAA ACCCAACCCT 
GATATATTCC TTGCGGCCGC CCATTCTCTC GGAAGGGACG TGGGCACTGC TGACGAATGT 
ACCGAAGAGC AAAAGGCGGA AAGAAGTCGA GGATTGGTGT TTGAGGATGC CCGGCCAGGT 
GTCTTGGCTG GCATCGCGGC AGGGATGAAT GGTGAGTCCA TGCGACTGGA GCATCTTTGT 
GGTTATCTAA TCATAAATAG TCATCTGGGT TCCTGATGCC GAATTACTTG CACTTAACCC 
GGGAGAGACA TACGGCGCGA CGGAAGTCCT TACTCATCTG GAGGAATGGG ATCCCACTAG 
GTGGGGCCTC CCTCCTTTAC CCGGTTTCAA TGTAAGTCAT CACGCTTTTT GAAACATGTG 
CGCATAGATA ACCTCTTGAT TATCACAGCA CATTCCTGCC CAACCCTAG

Protein sequence

MTALLAQRVL PQIEYAIFDM DGLLNAILGR YGHTMTWDIK AGVMGKPQRI AAEYILSHFP 
DILEKLTVEE FIAEGVQRRE ELFKRVEPMR GAAELVKGLH AAGIPIALAT GSTMPNFIHK 
TTHLPHIFSL FPPTSILTAD SPEVKRGKPN PDIFLAAAHS LGRDVGTADE CTEEQKAERS 
RGLVFEDARP GVLAGIAAGM NVIWVPDAEL LALNPGETYG ATEVLTHLEE WDPTRWGLPP 
LPGFNHIPAQ P