Gene CNC00520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNC00520
Symbol
ID	3256231
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006685
Strand	-
Start bp	147579
End bp	149224
Gene Length	1646 bp
Protein Length	428 aa
Translation table
GC content	49%
IMG OID	638255271
Product	hypothetical protein
Protein accession	XP_569342
Protein GI	58264372
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGAACAAAGA TTGACTCTTA GAACTTTGGT GGATTGGATG AGAAATAACG ACACTTGATT 
ACTGGATTAT AAAGGTCGAT GCAGATGGCC ACCAAGTATA GAGGGCTTCC GGACATAGTA 
CGTATTGCTT GCGAATACCC TTGCACAGAG CTCACGGATC ACCCATAAAC AGGATACTGC 
TCCAGATATC TTTGAGACTA CTGATGAGCC AGAGATTGTT CTCAAGCCGG TACGCTTGTA 
TTAGTAAAGC ACCACTCATG GATATAACTA ATGTCGGATC TTGTAGAGCG ATGTTAGGTC 
AGGAGACGAG GACTCTGTTT TGAAGCCCGT GTCAGAAGAC ATTGACGCCG GTGGGTTACC 
CTCCAGGCGT AAAGCTGAGC GCGTCTTTGC TCGGGGTACA AGAAAGCCAG GTAGGTACCT 
GAAATTGAGC AATGCCAGAG TAGCTAATCC CGGAATTATG CAGAATTGTC CACTCTCTCC 
TTTAGACCTC GACTTCCACC TCTTTCACGC TATGCGTCAT CATCGTCCGA TACCGATGAA 
GAGCCACCTT TACCACGGGA GACTCCAGCA GCACGATTGA GACGGTTGAA AGCAGAGCTG 
GCCGAGATTG AGGCTGAAGT GGGATCATCG TCCCCTTCCA AAACCCAGTC GATATCACAT 
GAAGGGAGCG GAGCAGGAAA GAGGAGGTCT GTTCTTCCGC CGAGGCAACC TGTGGATGTT 
GTGTCGGAAT TGGCGAATGT GAGAGAGCGC CTTGAGCGGG TAGAAATTGA TGGATTGGAT 
GTTGGGCAGG TCGTGGCAGT GGGGATGGGA CCCAGTTCTG AATGGAGAGA GAGGTTGGAT 
AAGTTGGTAA CGGCTGAGAA TCGCTCTGGG AAAGGCAAAG TTGCTCAGTC TACAGCAGTG 
GGACAACAAG ATAGCAGTCT GTCCGATATA GACAAACGAC TTGCTGCGCT TGAGCAAGTG 
GTTGGACCGA CTACTGACGG ACTGGATCAA GTGTGTTTGC TTTCCTCTTT CCAATATGGC 
TTCCCGTTAT AAGCGTTCCG ACTGACACCG AATACTGTAG ACATTGTCGC CTTTAGTTCC 
CACACTGAAC AAGCATGACC ATCTCCTCAC TCTACTTACT CAACCTCGGC ATCTCGACGC 
CATTTCGCGC CGTGTGAAAC TATTGTTGGT TGACCTTGAC AGGGCTGCTG CTGCTTCAAG 
GCGAACAGGT GCAGGTGGAG CGGCAATCCC CCAACAATCA AGCGAAAAAG CAGTTACAAA 
CCTCTCCCTG ACGCAAGGCG AATACACTCA ACTTCAATCA TTATTTTCAG TACTGCCGAG 
GTTGGACCCT CTCTTACCTA TTCTCACTCC ACTTCTTGCT CGTCTGCGAT CGTTATCGGC 
CCTGCATTCT GAAGCGAGCG AGATCGCCGT TTCGCTTCGA GAATTGCAAA GTAGAGATAA 
GAAGAATGCA GAAGAAATAA ACGAGCTTGA TGAGGTTGTA AAAAGTGTGC AAACAGGTTT 
AGGTGATGCA ATTGCGGCAA TCAAGAAGAA CTGGGAGGGC TTAGAGAAAA GGATGATGGG 
CTTAGAGCAA AGGTTGAAGG ACATGGAGCG TCAGATATAG ACCCAGCCAG AATGGAGAAT 
ATTCTGCATT GTATATGACT ATACCC

Protein sequence

MQMATKYRGL PDIDTAPDIF ETTDEPEIVL KPSDVRSGDE DSVLKPVSED IDAGGLPSRR 
KAERVFARGT RKPELSTLSF RPRLPPLSRY ASSSSDTDEE PPLPRETPAA RLRRLKAELA 
EIEAEVGSSS PSKTQSISHE GSGAGKRRSV LPPRQPVDVV SELANVRERL ERVEIDGLDV 
GQVVAVGMGP SSEWRERLDK LVTAENRSGK GKVAQSTAVG QQDSSLSDID KRLAALEQVV 
GPTTDGLDQT LSPLVPTLNK HDHLLTLLTQ PRHLDAISRR VKLLLVDLDR AAAASRRTGA 
GGAAIPQQSS EKAVTNLSLT QGEYTQLQSL FSVLPRLDPL LPILTPLLAR LRSLSALHSE 
ASEIAVSLRE LQSRDKKNAE EINELDEVVK SVQTGLGDAI AAIKKNWEGL EKRMMGLEQR 
LKDMERQI