Gene CNI04230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNI04230
Symbol
ID	3259777
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006694
Strand	-
Start bp	1121846
End bp	1122944
Gene Length	1099 bp
Protein Length	329 aa
Translation table
GC content	51%
IMG OID	638258918
Product	spliceosomal zinc finger-containing protein, putative
Protein accession	XP_572920
Protein GI	58271528
COG category	[R] General function prediction only
COG ID	[COG5152] Uncharacterized conserved protein, contains RING and CCCH-type Zn-fingers
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGAAG CGCCTGCACC AGTAGTCACA TTCAAAAAAG GCCCTTCTCG CCGTCCCGCC 
CAATCTCGCC AACGTCGTCG CTCTCCATCG CCTCTCGACC CTGTCGCTGA AGCATCCGCA 
TCCGCTTCCG GCTCCAATGT CGTTCGACCG GAGAGAAAAT CTCTCGCTAA CCCTCTCGTC 
CAAGGCACAA AGCGTCGGAG AACAAATGCC AATAATGAAG AGGAAGAGGA TGGTGTGGGA 
GGCGGATTGG ATGAGTTTGA TTATGCTGCC GAAGGAGGAC TGACGAGGAA AGGGGATGAG 
CTTGCAACGA GGGCAAATGA TTGGGATTTG GAGGATGTAG ATGGACAAGG GCAAAGGGAT 
AAGAAAGTCA GGCTAGATGA GGTGAGTCAT GCTCTGAATT TAGTTTATTT ACGGTGAGAT 
TCTGACAAGC CTCAAAGGAC GGCGAGATCG TGACAGATGA CGGCCTGTAT CGAGGTGCAT 
CCGCCTACTT ACCGACAATA AACAAGACCC GCGAAACACT CGACAAGAAG ATGAAATCCG 
GTCCTATCAA AGCTACCTCC CACGTACGCA CAATCACCCT CATGGACTAC CAGCCCGACG 
TCTGCAAAGA TTATAAAGAG ACCGGTTTCT GTGGATATGG CGATTCTTGT AAATTCTTGC 
ATGATAGAGG AGATTATCTG GCGGGCTGGC AGCTGGATAA GTTGCCGGAA GAAGGAGTGA 
GAGAGGTAGA GGAGGAGGAT GAGGAAGAGG AAGTACCGTT TGCGTGTTTA ATCTGTAGAC 
AACCGTTTAC ACAGCCGGTG GTTACCAAAT GCGGGCATTA CTTCTGCATG GGGTAAGTAT 
TCATTCGCTC ACTTTCATTT TTCCCGGCTG ACAAATATGT TCTAGGTGCG CTGCGAAACG 
ATTCCAAAAA TCACCCAAGT GCTACGCCTG CGGTGCCCCG ACGCAGGGTA TATTCAACAT 
CGCCGATAAA GTAATTGCCA AAATCGAAGC TCGTAACAAG GCAAGGCGAG AGGCGAGAGA 
GGAACGGGCA GAGCAAACGG GTGGTGGCGG GATTGAGATT GGTGGTGGGT CTGATGAAGA 
GGGTAGCGAT GAGGAGTAA

Protein sequence

MSEAPAPVVT FKKGPSRRPA QSRQRRRSPS PLDPVAEASA SASGSNVVRP ERKSLANPLV 
QGTKRRRTNA NNEEEEDGVG GGLDEFDYAA EGGLTRKGDE LATRANDWDL EDVDGQGQRD 
KKVRLDEDGE IVTDDGLYRG ASAYLPTINK TRETLDKKMK SGPIKATSHV RTITLMDYQP 
DVCKDYKETG FCGYGDSCKF LHDRGDYLAG WQLDKLPEEG VREVEEEDEE EEVPFACLIC 
RQPFTQPVVT KCGHYFCMGC AAKRFQKSPK CYACGAPTQG IFNIADKVIA KIEARNKARR 
EAREERAEQT GGGGIEIGGG SDEEGSDEE