Gene CNN01940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNN01940
Symbol
ID	3255384
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006683
Strand	+
Start bp	561719
End bp	563999
Gene Length	2281 bp
Protein Length	480 aa
Translation table
GC content	51%
IMG OID	638254613
Product	conserved hypothetical protein
Protein accession	XP_568675
Protein GI	58262530
COG category	[R] General function prediction only
COG ID	[COG0724] RNA-binding proteins (RRM domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ACTTTACAAA AATGACCGAA GACATTTACA AGGACGATCT CTACGGCGGT GGGTTCTGAC 
TGCATTCCTC TACGTCGTGA GTCATGAACT AACAGCGACA GATCTCGACC TCGAGGATTT 
GGATGCTTCT CAACTTGAGG AGCTTGTCGA GCCTCCTGAG CTGGATACTG CACCAACCTC 
GACTCCTGCT GCATCCAACG CTGCTGCGGC CCCTTCTCAA CCCGCAATCA CCGCATCATC 
GTCAACTTCC GCCCCCGTTG AACCCGGATC ACAACAATAC GACCATCAAC CATCTTATGA 
CGCCGCCACG CCTTATCAGC AAGGCCAACA GGACAACAAC TTTGGCCAGC AGCAAGACGG 
ACAGGATAGA ATCAAGCCCA GTGATATGCC TGATGAGGGG TTAGTAGATA TTCTGTTCAC 
CTTTTCTACA TTATCATTCG TCGTGGAGTG TGCTGGATGA AAGGAGGCCG CGCAGGTTTT 
TGTCGCGGCG GAAAAGCGCT TGTAGGATCC TTTAAAAGGC TCTTCAATCT TAGGATTTAC 
CAGCATCAGC TAGGCCGTAG AATTAGGCCA TAGGTCACAA TAGGACTGTA AAACCCGTAC 
CAGTAACGTA CCCCTTTAGC CTTGTCTTAC TTTTCCTTTT CCCTGTCTAT AGCCTTAGAT 
GAGCTGAACT AATCTGTACA CAACATACAT TACCCATACC TTTCGATAAC CCACATATCG 
TCTATTTACT GGATGCCATG CACCCCCTCT CGACCCGTCG CCCTTCACCT TTTTTTTTTG 
CCTGAACGTA CTATGTTTTT AACCGTACAG GAAGATGTTC ATTGGCGGTC TCAACTGGGA 
AACCACTGAA GGTCAGTTGC GACCACTGTC CTTTCCCCCT AAAACTGACA TTGCGACAGC 
GGGTCTTTCT GAATACATGG GGCAGTTTGG TGAAATTGAT GCTTGCACCA TTATGCGTGA 
TCCTTCCGGT CGTTCAAGAG GTTTTGCATT TTTGACTTAT AGAGACCCCG CCAGTGTCAC 
CAAAGTGATG GCGCAGACTC ATCATCTCGA CGGTAAGCAA GTGAGTACTT CCTTCCAACT 
CACTTGAATA TCTACCAACG GTGCATACAG ATCGATCCCA AACGCGCCAT CCCCCGCGCC 
GAGCATGAGC GTACCGCCAA AGTCTTTGTT GGCGGTCTCG CTCCGTCCGT CACAGGTGAA 
TCCCTCAAAT CTTTCCTCTG TCAATTTGGT CAGGTGATGG ATGCTACTGT TATGTTCGAT 
AAGGAGACTG GCAGATCTAA GGGGTTTGCA TTTGCTACGT TCCAGGATGA AGAGTCTGTA 
GGCAGAGCGA TGGCTGCTAG CGGTGTTGAG CTTGAGGGCA AGCAGGTTAG TCATACTGTA 
TTTCTACGCC AGATCCGTTG GTTAAGCAGA AAATGTAGAT TGAGATCAAG AAAGCTCAGC 
CAAGAGGTAC TGCTCAGGGA TCCAAATTTG GAGGTAACAT GAATCCCCGC TTTAACCAAG 
GCACGGGATT CAGTGGTGGT ATGGGTAGTT TCGGCGGTGG CTTCGACCCC AGTTCGGTGG 
CGATGATGTA TCAGAACATG ATGAAAACCG GAGGTAAGGG GAAGACCCTT TTTGACATAT 
CCCAGCCACT GACATTGATA AAAATCCTCA GGCAATATGA TGGGCGGCTT CGACCCTAGC 
GCCATGGCAA TGATGTACCA AAATATGATG AAATCCATGG GCAACGCTCC TGCCATTAAT 
CCCAGTCTTG CTATGCGCAA CAATGCTGGC GGGACCACTG CCGGTGCTGC TGCAGGGGGT 
GCTATGCCGA TGGGCATGGG TATGGGTGCC ATGGGGGGTA TGGGGGGTAT GGGAGGCATG 
GGCGGTATGG GCGGTATGGG GATGGGTGGT ATGGGAATGG GCGGAATGGG TATGGGCGGA 
ATGGGCGGAA TGGGTGGAAT GGGTATGGGA GGCGGGATGA ACCGCGTGAG TCTTTACTTA 
CTCTGTGCGG CTACTTACAA ACATACTGAT GGCCGTAACT TCCTAGATGG GCAACACTCG 
ACAAATTCCC AACGCTCCCC GCGGCCCTGC GGCGATGCGC GGACCAGGAC AACAGCCCAT 
GGGCGGCGCT GGAAATGCTC CCCAAGGTGG TGGACCCGGA GCGCAGAGAT ATTCGACGCA 
AGGGAACGCG AGGGCAAGAC CATATTAAGA TTGCGGATAG TTTAAGGAGA GGCCCACAGC 
CCGCATTGAT CAAAGAAATG GAGACAGTAG GGGTGTTGTA GGCTTTTAAG CAAAATGCAC 
C

Protein sequence

MTEDIYKDDL YGDLDLEDLD ASQLEELVEP PELDTAPTST PAASNAAAAP SQPAITASSS 
TSAPVEPGSQ QYDHQPSYDA ATPYQQGQQD NNFGQQQDGQ DRIKPSDMPD EGKMFIGGLN 
WETTEAGLSE YMGQFGEIDA CTIMRDPSGR SRGFAFLTYR DPASVTKVMA QTHHLDGKQI 
DPKRAIPRAE HERTAKVFVG GLAPSVTGES LKSFLCQFGQ VMDATVMFDK ETGRSKGFAF 
ATFQDEESVG RAMAASGVEL EGKQIEIKKA QPRGTAQGSK FGGNMNPRFN QGTGFSGGMG 
SFGGGFDPSS VAMMYQNMMK TGGNMMGGFD PSAMAMMYQN MMKSMGNAPA INPSLAMRNN 
AGGTTAGAAA GGAMPMGMGM GAMGGMGGMG GMGGMGGMGM GGMGMGGMGM GGMGGMGGMG 
MGGGMNRMGN TRQIPNAPRG PAAMRGPGQQ PMGGAGNAPQ GGGPGAQRYS TQGNARARPY