Gene CNK02950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNK02950
Symbol
ID	3254500
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006680
Strand	-
Start bp	865595
End bp	866596
Gene Length	1002 bp
Protein Length	280 aa
Translation table
GC content	50%
IMG OID	638253786
Product	endopeptidase, putative
Protein accession	XP_567890
Protein GI	58260960
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0638] 20S proteasome, alpha and beta subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.0631891
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCATCT CAAACGTAAG TTTCCACGGC GGACGGAGGA CACCATATCC AGCGCTGACA 
TAACGCAGCA CCCCGCCCTC TGGAAACAGC CCGCTCCAGC AAACTCTGCT TTCAACGACT 
ACAACACCTT TCCCCTCGGA CAAACGCAGC GCCACAACAC TTCTTCCCAC CATGGTCCCA 
TGTCCCACAC CCAACAACCT CTTGTCACCG GTACTTCTGT TCTCGGCATC AAGTTTGACA 
AGGGCGTGAT GATTGCGGCT GATAACCTCG GTTCATACGG TTCTCTTGCG AGGTTTAGAG 
ATATCCAGCG TCTTCATCCT CTGGGGAAAC ATACCCTTTT GGGTGTGGCG GGCGACATGT 
CTGATTATCA GTGGTTGAAA AGGGAGCTCG ATGGACTCTT GTATGTCCAT CTGTGGAAAA 
CGGCGTAAGA TGTGATGCTG ACAGAATTAT GTAGACGAGA GGAATCTGCT CTCTCCCTGA 
CCGATTCCCA CCCATCGCTT TCTCCTTCCA ATATTTACAC TCTTCTCTCC AATCTCTTCT 
ACGCTCGTCG AAGCAAAGTT GACCCCATCT GGAACGCCGT CCTCGTCGGT GGTTGGGACG 
ACACCAAAAA AGAAAGTTTC CTCGCATATG TCGATTTGCT TGGTACAACT TATTCTGCGC 
CCACACTCGC GACGGGCTTT GGAGCCCATC TCGCGCAACC GCTATTGAGG GAAGCATATG 
AAGCAAAGGC GGGGATTGAT GGCAAGGGGC CATTGTTGAC GCAGGAGGAG GCGGAGAAAT 
TGATTGATGA TTGTATGAAG GTGTTGTTCT ACAGGGATGC GAGAAGTATC AACAAGGTCA 
GTTTATATCT CTTATGGTTG AAAACATTTG TCTGATAAGA GGAAATAGTA CCAAGTCGCT 
ACTATCACAG ATGAAGGTGT CAAGATCAGT GACTCTAGAT CAGCTCCTAC AGAATGGAAG 
TTTGCAGAGG GTTTGAGAGG GTACGGGGCG CAGACCCAGT AG

Protein sequence

MAISNHPALW KQPAPANSAF NDYNTFPLGQ TQRHNTSSHH GPMSHTQQPL VTGTSVLGIK 
FDKGVMIAAD NLGSYGSLAR FRDIQRLHPL GKHTLLGVAG DMSDYQWLKR ELDGLLREES 
ALSLTDSHPS LSPSNIYTLL SNLFYARRSK VDPIWNAVLV GGWDDTKKES FLAYVDLLGT 
TYSAPTLATG FGAHLAQPLL REAYEAKAGI DGKGPLLTQE EAEKLIDDCM KVLFYRDARS 
INKYQVATIT DEGVKISDSR SAPTEWKFAE GLRGYGAQTQ