Gene CNI04140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNI04140
Symbol
ID	3259792
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006694
Strand	+
Start bp	1099507
End bp	1100686
Gene Length	1180 bp
Protein Length	180 aa
Translation table
GC content	48%
IMG OID	638258909
Product	metalloendopeptidase, putative
Protein accession	XP_572606
Protein GI	58270900
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0501] Zn-dependent protease with chaperone function
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.563575
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CAATTGGCCG CCCAAATCGC AAGAACTGTC CCGGCTGATC TCTGAACGAG AAGCCTTGAT 
AGGAGAAGGA GACAGATATT ACCTACCGAG TGGTACAGCT AAGAGTACAT ACGTACCCTA 
CAGACCGCCT ACCAACAACC CTTTGAAACA GTTTGAGTCG CCAGACTGGC GCGTGTATGT 
GATAGATTCA GTAAGCTCAT AAACCTTTTC GGGAAACTGT TGTTTCTAAA GTCTGACAAT 
CCCTTTCGGT GTTAGCCTGA AGTGAATGCC TTCGCCCTAC CAAGCAGAGA TGTTTTTGTT 
TACACCGGTC TCCTTGACAC ACTGCCCGGG GATGATGTCA TGCTGTCTGC AATCTTAGCC 
CATGAGATCG CTCATGTCGT AGAAAGACAT ACGGTTGAAA ATCTAGGAGT AAGTCTTACA 
GTTATTTGAG ATGGATCTTC CAGCGCTGAC TTGAATGATC TCAGTTCTTG AATCTGGCGA 
CTGTGGGATT TGACGTCTTG CGAGGATTGG CCTTTGCATT TACCATCTCC TTCCCATTGT 
ACGTACTGTT GAAACTGCCT GGAATGCTAC CTGATGATCG CTCATACGAG TGCACGAATA 
TAGTATCACG GACTCAGCCG GGATGTGTAT CAACTGGATC AACAATGTCC TCGCCGACAG 
AGCTTACTCT AGAAAACTTG AAATGGAGGC CGATGCTGTA GGCTTGGAGG TACATATGCT 
CTCGAATTGA GATCAATAAA ACGTGTGGCA TGTGCTGATA GCGATCAATC AGATCATGGC 
GACCGCAGGA TACGACCCTA GGGCCGCAAG CGACTTGTGG GAGCTTATGG CATGTGTGGA 
GGACGACGCA GCGGCGATGG GACAAGGGAT CAGTGTCGAG AACCGGTTCA CTCTGCTTAG 
GACGCATCCG ACAAGTGACG TTCGACTAAA AGTAAGCAAT TGGAAGCGTA CGCATTTTTT 
ACTTTGTGCC CTGACTGGAA TTTGATTTCT AGGCTCTCAG CAAGGATATG GAAGGTGCGC 
TGAAGATTTG GCGGGACCAT AGGAGGAAGC GTCAGCCCAA GAGAGTGGAG AAAAAGCAGG 
AAAAGAAGGA TAACGTCCCT GAATCGGACA AAGCTGTATC GGAATAAGGA TGGTATTCCA 
GAAGATAGCA TGCGGTCGTT ATTTAGCATG CACTTATTCG

Protein sequence

MLSAILAHEI AHVVERHTVE NLGFLNLATV GFDVLRGLAF AFTISFPFIT DSAGMCINWI 
NNVLADRAYS RKLEMEADAV GLEIMATAGY DPRAASDLWE LMACVEDDAA AMGQGISVEN 
RFTLLRTHPT SDVRLKALSK DMEGALKIWR DHRRKRQPKR VEKKQEKKDN VPESDKAVSE