Gene CNK02040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNK02040
Symbol
ID	3254642
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006680
Strand	+
Start bp	611640
End bp	613653
Gene Length	2014 bp
Protein Length	482 aa
Translation table
GC content	49%
IMG OID	638253697
Product	expressed protein
Protein accession	XP_567680
Protein GI	58260540
COG category	[L] Replication, recombination and repair [R] General function prediction only
COG ID	[COG0494] NTP pyrophosphohydrolases including oxidative damage repair enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.239052
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGGGCGGATA CCTTGATTTA TATACCGCCC CTCTCTTAAG ATATCAACAA ACTGACATAG 
ACATATCGGC AACATGGTAG CCTCGCCTCC TACAGCAACG CCATCAACCG CGCTCTTGTC 
TCTTATCCAC TCTCTCCGCG CCTTGCCTAC TCGCCTCATC CAGTCCCCTC CGACCCAGCC 
ACGTCGTGCA TCTGTAGCTA TCATCATACG CCTGAGACCT GCTGAAGAGC TGGTTTTTGA 
AGGACATGAG CCAGAAGGAT GGACAGGAGA TGTTGTTTCG AGGGAAGATT GGGGAGAAGG 
GCTTGAACTG GAAGATTTTA TGAAGTTGTG TAAGTGATCA TCGTGAGAGG CACGAATGAG 
TAACCATCTG ACGCTATGGT ACAGCCTGGG TGAATCACCC TAATACTGTT CCAGAGATTC 
TGTTCATTCG CCGTGCCTCT CCCTCTTCTT TACCTCCTCC CGGAGCCCAT CACCGTTGGG 
CTTCTCATAT CGCCTTCCCC GGCGGCCGTC AAGAACCAGA CGATCAGTCG GCCTATTACA 
CCGCATTGAG AGAGACATGG GAAGAGATTG GAATAGATTT GGCTGAGAAA GAATTCCTGA 
ATGTAGGGCG GTTAGACGAG AGAGAGGTGA CCACAAGCTT AGGGAAAAGG CTGTTGATGA 
TCCTCAGTCC CTTTGGTACG TTTGATGTGC TGCATCTAGA ACAGGACTGA TTAGGTGGAC 
AGTATTCATC CAAACTACGC CAATAAGTCC GACTCCAGAG TTACAGGCGG TAAGTTCCTC 
AAATGCGTCT CCGATCATGT ACTGACATCT GGAAAGGCCG AAATCTCGTC TGTCCACTGG 
GTGCCTCTTT CTCTACTTAC GCCTCCCTTT TCACCTTCTC GTTGGTCGCA CGTCGAAATT 
GATGTCAGCA CTCGGTTGAG TCCCCGAAAC AAATTTGTAA GATGGTGCTT GAGAAATCTC 
ATAGGCAAAA TGAAGTAGGT TGTGTCTTTC CATATCACAT GTTATAGCAC TGATCAAAGC 
GTCAAAGATT TGGCTGTTTG CTTCTTCCTG ATGAGCCGGC CGTAACAGCT GAAAATTTTG 
ATCCCTTGGA TTTTGATGAA ACGTTGGAAG GAAGTGGTAG CTGGACCGAT GCAGCGGATG 
GCAGTCGATT TTTGAGGCTT TGGGGCTTGA CCTTGGGAAT GACCCTGTAA GCTGATCCTG 
CTCTATATCA TTCTGTAAAT CACTGATAAT CACTCTTTCC CTAGGGATCT TATCTCTCAT 
CATCCGTCTG CACCCTCCAA GCTATTAGCA GAAGGCCAGA ACCTTTCAAC CTCACAACCC 
AGTACTCCTG TTATGGAATA CAAGCCTCAA CTGGCCCCTC GCACTCCTGT GACCACTCAC 
AGTACTTTTG AGGACCAGTG GGAGGCTGCG AGGAAAGCAT TGGCGGAAGA AGAGAAGGAC 
AGGGCAATTG AGAAAGCGGC GCAAGGTAGA AGACGAAGAG GTGTAGGACC TTATATGACG 
TTAGTTGTTC GAAGATGCCC AGTTTCCATC AGGCTGACAG AATAGTAGTG CGGTATTCCC 
GAGATTCACA TATCCCGATG TCAATTTTTG GATATGGTGC GTAGCTTGGT CTGCTTGTCT 
AGCCTCCGCT CACTAGTATT CATCAGGGTC TTCTCTCGTC GGTACCGACA AGTGCTGAAA 
TCCTGGGAAT TGTCAGCCAT TGGCCCCTCT CGTGCAGCCG ACAGGCGTAT CAATTGGTCT 
GGTCAGGCAC TTGCTACCTT TTACACGGCA GTAAGACAAG CTTTGGTTGT GACTCTGATC 
ATCCGAGCTC TAGGTCTCGG TGTTGGGCTG GCGGGTGTGG GTTACTTGGC GTTCAAGGTT 
ATGGGTGGTG GAGAGCTATA AAAGCAAAAG CTGCATGTAT TCTGCTGTAG CTGTTGACTG 
GATAGATAAC TTTGAGTGTA TTAGCCTGAG GCCTGAGATG ATGGTTGTAG GATATTCATA 
TGCCTCTTAG CTATGTATGT GGTTCATTGT CATG

Protein sequence

MVASPPTATP STALLSLIHS LRALPTRLIQ SPPTQPRRAS VAIIIRLRPA EELVFEGHEP 
EGWTGDVVSR EDWGEGLELE DFMKLSWVNH PNTVPEILFI RRASPSSLPP PGAHHRWASH 
IAFPGGRQEP DDQSAYYTAL RETWEEIGID LAEKEFLNVG RLDEREVTTS LGKRLLMILS 
PFVFIQTTPI SPTPELQAAE ISSVHWVPLS LLTPPFSPSR WSHVEIDVST RLSPRNKFVR 
WCLRNLIGKM KFGCLLLPDE PAVTAENFDP LDFDETLEGS GSWTDAADGS RFLRLWGLTL 
GMTLDLISHH PSAPSKLLAE GQNLSTSQPS TPVMEYKPQL APRTPVTTHS TFEDQWEAAR 
KALAEEEKDR AIEKAAQGRR RRGVGPYMTA VFPRFTYPDV NFWIWVFSRR YRQVLKSWEL 
SAIGPSRAAD RRINWSGQAL ATFYTAVRQA LVVTLIIRAL GLGVGLAGVG YLAFKVMGGG 
EL