Gene CNA04350 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNA04350
Symbol
ID	3253356
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006670
Strand	-
Start bp	1167772
End bp	1169904
Gene Length	2133 bp
Protein Length	576 aa
Translation table
GC content	49%
IMG OID	638252755
Product	conserved hypothetical protein
Protein accession	XP_566789
Protein GI	58258753
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG5533] Ubiquitin C-terminal hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACCG CCTCCCCCTT CCTCTTCCAG TCGTCCCTGC ACGACACGGG GCTTATTCAC 
GAAATGCTTT CCAACCCGCT CAAATTCGGG GCTCCTGTTA ACAAAAAGAG TTTGGGCTTC 
GAGGCGGGTA TGAAGGAGGT TGTTTCAGAG CCAGAGTCTC CCAATCTTGT CAAAAGACAG 
CTGAAAAACG TAAATGATGA GGTGAAGTAC GACACGGAAG GAGAACTGGC GGCGAAGGAT 
AAGTCGCAGA AACAGTTTAA TGGCAATGCG AAGAACCCCC AAAGGGTGAA TCCGGAGTTC 
ATAAATCAAT CAGTAACTCC CCTTTCGCCA GCGAAATCCC AAATCCCTGA TACAAATGAG 
GGCGACAATA CTCAAGGTCT CTTCCCGTCC ACCTTCGACC TTTCTTGGCC AGAAGCCATT 
GCCACCGCTA AGCGTGCAGC TGGACTGCAT AATCCTTCGA TGGCATGCTA TGCCAATGCC 
ACTTTGCAGG TCCTGCTGCA TACGCCGCCC GTCCTGAGAA TCGCTTTGAC ACACGATGAG 
GGAAGCTGTG GGTGCTCAAT GGTTCATAAC TTCTCCAGTC CTTTGACTGA CTTCATCTGT 
AGGCTCACAA ATTAAAAAGA AGAATTTCTG CATGTTATGT TCTCTCAAGC ACATGGCTGA 
AGGATCGCAC TGGTCTGGTC GAAAGGCTTA CGCCCCAGGA ATCCACAGAA GCTTGTCGCG 
TAAGTCGTCG GAGTCCAACT TGTTTTATCA CCGACTTAAC TTTAATAGAA ATCAAGAAGG 
GCTTCAGCAA GAACAGGCAG GAAGACACCC ATGAGTTCTT CCGGTTTGTC ACCGACGCCC 
TGCAGAACAC TGCATTGGCC AAGCTTCCTA AGTGTGTCCT TCCTTACAAT CATCGGAAGT 
TTGCTCATAC AACATCCAGG GATACTCCTG AAAAGATCAA GCACACCTCT TGGGTTTACC 
GAATTTGGGG TGGCCGAGTG CGCTCACGTG TTGTTTGTTC ACGATGTAAC AACCCGTCAG 
ACACCTTTGA TTCCTTCTTG GATTTGAGTT TGGATGTGAA CAAGCAGGGC AAGAAAAGCG 
TGCTTGGGAT GTTGGCTGGC TTCACCAAGG AAGACAGACT CGAGGGAGAC AACAAGTATC 
ATTGTGAAAG GTGAGTTTCA TTTGTTGTGT TCAAAAGAGC GATAGCTTAC TTCAAAAAGG 
TGCAAACGTA AAGCCAATGC CACGAAGAGC TTCAAAATTG ACCAAGCACC TCCCATCTTG 
ACTCTTCACT TGAAACGGTT CAGTGTCAAC TACAATCCTT ACAGTGGCCG AGCTCGAGCA 
GAAAAATTTA ATCAGCCCAT CAAATTTGAA CAAACTCTTG ATATCGCGCC CTATATGGTT 
GACCCTGCGT CTCCCGGTAC CAAGTACAGA TTGTTCGGTG TCACCTGCCA TCGTGGTACT 
GAGCTTCGTT TTGGTCATTA CACTTCCTAT GTCCGAGGTC CTTCCGGTCA ATGGTTCCAT 
GCCGATGACG ATGAAGTGTC TCCTGTCCAG TTGGAGCAAG TCTTGAACGA CAAGACGGCT 
TATCTGTTAA GTTACATCCG CGTGGACAAT GGGAACGAGG GGCTGTGTGA ATCGCCTGCA 
GTTAGGGACA GAGTGAAAGG CTTGGTCAAC GGGAGTGCAA AGGGTATGAG AGATGACGAG 
TCGGAGAGTC AATCAGAGGC TGAGTCAAGC TCGCACAAGT CATCGTCACC GATCAAGCGT 
AAATCCACTT ATGACCCTGA AGACCCACCG CGCATGAAAA TTGGCGCCTT TGTCAACAAC 
AAGGCCTACG CACCTTCAAC AAACAAATCT GAGTCGCCAT TCTCAGACGG AGAGAACAAA 
ATGCCCCCCG AACTCCCCAA ATTCGGATAT AAACCTAAAC CCACCATTCG CGCCCCTGCT 
CCCGTGGAAG CTTCATCTTT CTACACTTCC CCTGTCGCTC GACCATCCAA TTCATTGGCA 
GGTATGAGTA AGAAGGAAAA GAAGAAGTTC AAGCATAAGG AAAAGGGAAA GCCTAGACAT 
AGCGCTACGC CAATGCCCTT CGCCCAAGGA AGGGTGGGTA ATGGTAGAAA CAGGCAGCCA 
GGTGTTCTTT CGAGGATGAA GGGCAGAGCG TAA

Protein sequence

MTTASPFLFQ SSLHDTGLIH EMLSNPLKFG APVNKKSLGF EAGLFPSTFD LSWPEAIATA 
KRAAGLHNPS MACYANATLQ VLLHTPPVLR IALTHDEGSC SQIKKKNFCM LCSLKHMAEG 
SHWSGRKAYA PGIHRSLSQI KKGFSKNRQE DTHEFFRFVT DALQNTALAK LPKCVLPYNH 
RKFAHTTSRD TPEKIKHTSW VYRIWGGRVR SRVVCSRCNN PSDTFDSFLD LSLDVNKQGK 
KSVLGMLAGF TKEDRLEGDN KYHCERCKRK ANATKSFKID QAPPILTLHL KRFSVNYNPY 
SGRARAEKFN QPIKFEQTLD IAPYMVDPAS PGTKYRLFGV TCHRGTELRF GHYTSYVRGP 
SGQWFHADDD EVSPVQLEQV LNDKTAYLLS YIRVDNGNEG LCESPAVRDR VKGLVNGSAK 
GMRDDESESQ SEAESSSHKS SSPIKRKSTY DPEDPPRMKI GAFVNNKAYA PSTNKSESPF 
SDGENKMPPE LPKFGYKPKP TIRAPAPVEA SSFYTSPVAR PSNSLAGMSK KEKKKFKHKE 
KGKPRHSATP MPFAQGRVGN GRNRQPGVLS RMKGRA