Gene CNN00820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNN00820
Symbol
ID	3255510
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006683
Strand	+
Start bp	264612
End bp	266723
Gene Length	2112 bp
Protein Length	560 aa
Translation table
GC content	49%
IMG OID	638254498
Product	pseudouridylate synthase, putative
Protein accession	XP_568627
Protein GI	58262434
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0101] Pseudouridylate synthase
TIGRFAM ID	[TIGR00071] pseudouridylate synthase I

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCCCAC GCGTAACAGC ATTTCTTAGC AATATACTCA GGCAGCCAGC TTTAAAACGC 
ATAATGGAAC ACACAGAACC CATGAAGAGG CCCAGATCGC CATCTCCGCA GCAGGCAATG 
GTACCAGAGG CCAAAAGACC CCATATCGAA CCGGCACCGG TACCTGCTGC AGTCCAAGTT 
GATGCCGAAG AAGCAATGTT CAATGTCGAA GAAGAAACTC AAGGTGGCAA AGGACGGAGA 
GGGAAGAGAG GAAATGAAGG CCAGGCTCGT AAAGAGAAGA AAGAGAAACG AGATGCCAAG 
GACCCGAGGG CTCAACGAGC TTGGGAACCC AGCGAGAAGA CCAATGGCGA AAAACGGTTG 
CCCAAGAGGA GGTGCGCTGT GTTGATTGGG TGGGTCTTGC AACGTTCTGG GCGTGGTAGC 
AGCTTTATGA CTAATGCGAA TACAGCTACT GCGGTACTGG ATACCAGGGT ATGCAAATGT 
GCGCTTTTTT CATTGTCTCT GGCCGCTCAT TTGCCAATCC TTACATTATT GTAGACAAGA 
CCACACTGAC CGAACTATTG AGGGCGAAGT CTTTGCTGCT CTTGTCAAAG CTGGCGCTGT 
CTCTGCCGAC AATGCTATCG ATGCGCGCAA GGTCGACATT GCTCGAGCTG CTCGAACGGA 
TGCTGGCGTT CACGCCGCCG GTAATGTTAT CTCCATCAAA ATGATCACAG AACCGCCTCT 
TCCCGAAGGC TTCAAAGATG TCGCCGAGTA TGTCAACACT TTCTTACCAG ACCAAATTAG 
GATGTGGGGC TGGGTCAGAA CCGTCAAGTC CTTCAACGCC CGAACGTGAG TCTTCGCTAC 
CTGTGACTGT ACCATGGATT ACGGCTGATG ATGGCCCTGG TAAAGGGCGG CCGACTCTCG 
TATATACGAG TACCTCCTTC CGTCATACTG CCTCATACCT CCCCACAAAG ATGACTCTCT 
TGCCAAGCAT CTCGATTTAT CCTCTCCCGA CTGGCGAGAA ATCGTCGGTG AGGGTCCTTG 
CTCCTTTGCC GACGCTAGAC TCCCTATGCC CACTTCTGAC GAAGGCGAAG TCGACCCCAA 
GGTTCGAGGA GAGTACGAGA GAAAAAGAAA GTGGAGAGTG GATGAAAAGA CTTTGGGCCG 
GTTCAGAGAC ATCATTGCCC AGTACAAGGG TACTCAGTGA GTGTTCGTGT AGAACAGATA 
CAACTGGCCA GAACTGAGGG AATGTCAGCA ACTTCTACAA CTACACTGTT GGCAAGCCTT 
TTAATGACCG AGCAGTCAAG AGGTTTATGA TCAAGCTTGA GGTGAAGGAA CCCAAGGTGT 
ATGGAGAGAT TGAATGGATT TCCGTTCAAA TCCACGGACA AAGTTTCATG CTTCATCAAA 
TCGTAAGTGT ACTATATTTA TACCAGTAGA CATTATCAGC TCATGGTGCC ACAGCGAAAA 
ATGATCTCCA TGGCGATGCT CGCCTGCCGA ACTGGTTCTC CTCCCTCTCT CCTCCCCGAG 
ACATTTGGTC CCAAGAAAAT TCACATTCCC AAAGCCCCCC CTCTCGGTCT CTTGCTCGAG 
GCTCCTCAGT TTGGCGTTTA CAACGACAGG ATCACCCAGA AGTTGAATGG CATCACCGAA 
GACAGGGATC CGGTAAACTT TGGTCTGTAT GCGGATGAGA TCTATGCTTT CAAGGTGAAG 
TGGATCTATG AAATGCTGAG GAAGGAGGAG TTAGAGAAGA ACGTGTGAGC CAAAAGCTTG 
CATGGTATGA CTGTTTCAAT GCTGATGAAT GGATAGTTTC CACAAGTGGA TCCAAATGAT 
GGACAACATC AAGAACGATT CTCTCGGTTA CCTCAAGTAT GTCACTTCAT CCATCTTCGC 
CGCAGTGATT CATGCTGACA TTCAATTTAG CACTAAGGGC ATTATCCCGG CAGAAGCCAC 
TGCCTTGGTA CTTGAGCAGG AGAGCAAGCG AAAGGAGGGT CAAAAGACTC AGAAGGAAGG 
TGTTGAAACC GGAGTCGAGG AGATTGAGAG TGATGACGAG GAGGTTGACC AAGAGGCCTT 
GAAGAGGGGT GAATTGGAAG GGTAGTTCAC CGCTGTAAGA TAAGCAATTA CATTATACTC 
ATGTATGCAT AT

Protein sequence

MIPRVTAFLS NILRQPALKR IMEHTEPMKR PRSPSPQQAM VPEAKRPHIE PAPVPAAVQV 
DAEEAMFNVE EETQGGKGRR GKRGNEGQAR KEKKEKRDAK DPRAQRAWEP SEKTNGEKRL 
PKRRCAVLIG YCGTGYQGMQ IQDHTDRTIE GEVFAALVKA GAVSADNAID ARKVDIARAA 
RTDAGVHAAG NVISIKMITE PPLPEGFKDV AEYVNTFLPD QIRMWGWVRT VKSFNARTAA 
DSRIYEYLLP SYCLIPPHKD DSLAKHLDLS SPDWREIVGE GPCSFADARL PMPTSDEGEV 
DPKVRGEYER KRKWRVDEKT LGRFRDIIAQ YKGTHNFYNY TVGKPFNDRA VKRFMIKLEV 
KEPKVYGEIE WISVQIHGQS FMLHQIRKMI SMAMLACRTG SPPSLLPETF GPKKIHIPKA 
PPLGLLLEAP QFGVYNDRIT QKLNGITEDR DPVNFGLYAD EIYAFKVKWI YEMLRKEELE 
KNVFHKWIQM MDNIKNDSLG YLNTKGIIPA EATALVLEQE SKRKEGQKTQ KEGVETGVEE 
IESDDEEVDQ EALKRGELEG