Gene CNG02390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNG02390
Symbol
ID	3258736
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006692
Strand	-
Start bp	683885
End bp	685222
Gene Length	1338 bp
Protein Length	367 aa
Translation table
GC content	50%
IMG OID	638257859
Product	conserved hypothetical protein
Protein accession	XP_571964
Protein GI	58269616
COG category	[R] General function prediction only
COG ID	[COG3491] Isopenicillin N synthase and related dioxygenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGTCC CCGTCCCTCA AATCTTCCAG TACGACTACG TGCCCGAGAC CAAGGAGGAT 
CTTGAATGGG CTGATCGTGA GTCTGCTCTC TTTTCTATTT TGTCTTGTGG GCGCACAGAC 
TGACTCTTCA TCTTAGTCGC CACCATTGAT CTATCCAAAT TCAACAATCC TGAAGGCCGC 
AAGGAGCTCG CCCAAACCCT CCTCGAGGCT ATCCGCACTA AGGGATTCTT CTACGTCATC 
AACTTTGGCA TTCCCCAGGA GAAGGTTGAC CGCCAGTATG CCCTTGGTAG CAAGTTTTAC 
GATCTGCCCC TTGAGGAGAA ATCCAAATAC GTCCCTGACT TGGAGAATGG CGAATACAAC 
GGGTACAGGC CCGCTGGCAG GAGTGTACTT GGAGGGGGTA TCCGGGACAG GATTGAAGTC 
TATAACATCC CCAGTAAGTC ACATTCCTCT GTTCATTTGT CTGTCAATTT CCCGTCCAGA 
TCCCACTGCT GATATTCAAT CAGAATTTGA TGGCTATCAT GAGCGTAACC ACCCCGACGT 
CATTGAGCAG AACATTCATG AAATCGAGGA ATTCGCTCGC TCTCTCCATA CCAACGTCCT 
CGACCCTCTT CATGTTCTCG TCGCTCTCGC TCTTGAACTT CCTGAGGACT ACTTCACCAA 
TCTTCACAAG TACTCCGACC CCTCCGAGGA TCATCTCCGA TACATGATGT ACCGGCATTT 
CTCTCCTGAA GAGACTAAGA TCATTGAGTC CAACGATGGT CTTTACACCC TCGGTCACAC 
CGACTTGGGT ACTTTGACCT TGCTTTTCAG GCAACCAGTT GCCGCTTTAC AGATCAGGGA 
CCATGAGACT GGCAACTGGA AGTGGGCCAA GCCCTTGGAT GGTAGCCTTA CCGTCAACAC 
TTGTGATGCC CTATCTTTCT TGACTGGCGG CTACATCAAA AGTACCGTCC ACCGAGTGAG 
TAATCTTTTA ACGCAGTTTC GAGTGCCGGA GCTGACGCAG CGATTTAGGT GAGCATTCCG 
CCCAAAGACC AGCAGCAGTA CGACCGTCTC GGTCTCCTCT ATTTTGCCCG TCCTCAAAAC 
GATTTACCCC TCGCCACTGT TGACAGCCCC TTGCTGAAGA GAGAGGGTTT CGACAAGAAT 
GAGTTTGAAC GAGGCGGTTA CAAAGTGCCG ACCATGGGTG GTAAGTCACA ATCTCGCCAT 
CACCAAAACT TCCGTTGATG TTTTCCCGTA GAATTTGTAC AAGTCAAGCA AAAGTGGCAG 
CAAACCAAGC GAGTTGCACA CCGAGAAGGT GATGGTTCCC AGATTCTTCC TGGTTTCGAA 
GGAAAGTATC ACGACTAA

Protein sequence

MPVPVPQIFQ YDYVPETKED LEWADLATID LSKFNNPEGR KELAQTLLEA IRTKGFFYVI 
NFGIPQEKVD RQYALGSKFY DLPLEEKSKY VPDLENGEYN GYRPAGRSVL GGGIRDRIEV 
YNIPKFDGYH ERNHPDVIEQ NIHEIEEFAR SLHTNVLDPL HVLVALALEL PEDYFTNLHK 
YSDPSEDHLR YMMYRHFSPE ETKIIESNDG LYTLGHTDLG TLTLLFRQPV AALQIRDHET 
GNWKWAKPLD GSLTVNTCDA LSFLTGGYIK STVHRVSIPP KDQQQYDRLG LLYFARPQND 
LPLATVDSPL LKREGFDKNE FERGGYKVPT MGEFVQVKQK WQQTKRVAHR EGDGSQILPG 
FEGKYHD