Gene CNG03640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNG03640
Symbol
ID	3258636
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006692
Strand	-
Start bp	1020653
End bp	1022226
Gene Length	1574 bp
Protein Length	452 aa
Translation table
GC content	48%
IMG OID	638257988
Product	DNA-(apurinic or apyrimidinic site) lyase, putative
Protein accession	XP_572070
Protein GI	58269828
COG category	[L] Replication, recombination and repair
COG ID	[COG0177] Predicted EndoIII-related endonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.433978
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TCAAACATCA GAATAATGTC GAGAAGGCCA AATCTCCGCT CAACAAAGTT AGCACTCAAC 
CAGAAGGTCT CTATTATCCC AACAGATGCG GTCAAGGCAG AGCCGCCAAG CTCCAAGCTT 
ACGTATAGTT CCCTCCGTCG ACCGACCAGA TCGAGTGCTA CAGTGGAAGA ATTGGCATCG 
CCCGTCAAGA AGAACAAATT AAACATCGCC AAGTACGAAT ACAAGGGCTC GATACCTTCC 
CCTAGGAAGC GTCCGAGGAT AGATGATGTT GTCAAGGAGG AAGAAATTGA AACAAAGGCA 
AGCCCAATAA AGTCTCCGGC AAAAAAACCA TTGCCACAGG TAGCGCTTGC AAAACCTCAT 
GCGGCCCCTG CAAAATGGGA AGAACAGTAC CGATTGATTG AAAAGATGAG ACGGGGTATT 
GTCGCTCCTG TTGATGATAT GTAAGCGATT CGTGACCTCT CGTGCCGAAC GCATATACTG 
ATAGCTTTGT TTAGGGGCTG CGAACGGCCG AGAACCAATA CCGAAGGAGA TCCAAAGGTA 
TTTATTTTCA GTTAAAGCCT CATGTCGGTG CTAATCCGAG CATAAGACTT TTCGTTTCCA 
CATCCTCATA TCTCTCATGC TCTCCTCTCA AACAAAAGAT GCTGTGACCT CAGCAGCCGT 
CACCTCTCTT CACACCTCTC TGCCAGGTGG TCTTTCTGCC GCCTCTCTGG CCGCTGCACC 
CTTGGAAACC ATCCAGGAAT GTATCAACAA GGTTGGATTC TGGCGACGAA AGGCAGAATA 
CATCCAAGAG GCTGCAAAGA CACTTTTGGA ACAAGAAGGA GATGAGAAAG GAGACGTGCC 
AAAGACGGTC GAAGGTTTGT GCAAGTTGAA GGGCGTAGGG CCTAAAATGG CTTTCTTGGC 
CCTGCAATGC GCTTGGGATA TGTATGTAAT CTTTCGTTAT CCTTCATCTA TACCTCTCAA 
CTGACATAAA ATAAAAAGTA ATGCTGGAAT CGGAGTTGAC GTCCACGTTC ATCGCATCAC 
AAATCGCCTC AAATGGCACC GTCCACCTAC ATCCACCCCA GAACAAACCC GACTCAACCT 
TCAATCATGG CTTCCCCCCC ATTTACATAA ACCTATCAAC CCCTTGATGG TCGGTTTTGG 
TCAAGTGATC TGCCTCCCAG TTGGGCCTAG GTGCGATATC TGTCTGTTAG GCCAAAAGGA 
GATATGCCCA AGTCGAGTAA AAGGGGCGAA TGCCAAGGGC AGAAAAGAGG TGACGTATAG 
CTTCAAGGAA GAGGAGGATG AACTTGCTAT CGGGCAGTGG CGGTGGGGTC AAGCGAAGGG 
AGTTAAGAGT GAGGCCAAGG TTGAGATTGG ATATGAGGGA GGATTAGAGA AAATCAAAGA 
TGAGGAACCA GAGAATTCGG TCGAGGTGGA GCAGATGATC AAGGAACCAG GGATGAGACG 
ACCTGATGAA GTGTTAGAGG TCTTGGATCA GGTAGATGGC CCCACGGATA TCGGGGCAGA 
GCCTGTCATA AAGACCGAAA ATGTCGATTG GTAATCATTG GGTATCATAA TCAGTCTTTG 
CATCATTCGT CGGT

Protein sequence

MSRRPNLRST KLALNQKVSI IPTDAVKAEP PSSKLTYSSL RRPTRSSATV EELASPVKKN 
KLNIAKYEYK GSIPSPRKRP RIDDVVKEEE IETKASPIKS PAKKPLPQVA LAKPHAAPAK 
WEEQYRLIEK MRRGIVAPVD DMGCERPRTN TEGDPKTFRF HILISLMLSS QTKDAVTSAA 
VTSLHTSLPG GLSAASLAAA PLETIQECIN KVGFWRRKAE YIQEAAKTLL EQEGDEKGDV 
PKTVEGLCKL KGVGPKMAFL ALQCAWDINA GIGVDVHVHR ITNRLKWHRP PTSTPEQTRL 
NLQSWLPPHL HKPINPLMVG FGQVICLPVG PRCDICLLGQ KEICPSRVKG ANAKGRKEVT 
YSFKEEEDEL AIGQWRWGQA KGVKSEAKVE IGYEGGLEKI KDEEPENSVE VEQMIKEPGM 
RRPDEVLEVL DQVDGPTDIG AEPVIKTENV DW