Gene CNH00650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNH00650
Symbol
ID	3259350
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006693
Strand	-
Start bp	998752
End bp	999847
Gene Length	1096 bp
Protein Length	252 aa
Translation table
GC content	51%
IMG OID	638258418
Product	conserved hypothetical protein
Protein accession	XP_572258
Protein GI	58270204
COG category	[R] General function prediction only
COG ID	[COG2110] Predicted phosphatase homologous to the C-terminal domain of histone macroH2A1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.110793
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATATCCG ACGGCGATCT CCAGTCGTCA CTCAAGATTC GCTCGAGATA TAACGGACAC 
TACTCCTGCA TGACGCTTCC ACGTCTGGCA AGCCGGCTCG CAAAGACCAT GACACCCGCC 
GACATCCCTA CCCTTTCCCA GCTCTACCGC CATGATCACA CGAATGCACT CAATCCCACC 
AAGCCAAAGT ATGAGTTTAC GAAACAGCTC AATGATCGGG TCTCCATTTG GAGAGGAGAT 
ATCACCGAGC TCGAGGTGGG TGTTTTTCCT CCGTCTAGAC TAGTCACCTC GCCAACTTTA 
CGTCTGTATA GGCCGACATG ATCGTCAACG CTGCCAACTC GTCACTCCTC GGCGGGGGCG 
GCGTCGACGG TGCGATCCAC CGGGCTGCAG GCAAGCACCT GCTCGAGGAA TGTAAAAAGC 
TGGGCGGTGC CCAGACGGGG GAAACAAAGT TTACCGCCGG CTACAACGTG CGTCCTATAC 
CCCCCTTGCA GTCACGCTGA AAAAAGCCCC AGCTATCGAG CAAGAAGATC GCACATACAG 
TCGGACCCGT CTACCACTCG CACCCACCCC AACGTGCAGC CCAGCTTTTG AAAAGCTGTT 
ACCAATCGTC GTTGGAAGGG TGTAGAGATT CGGGAGGAGG CGTCATTGGG TTTAGCAGTA 
TCTCTACCGG CGTCTGTACG TCAAGAGTCT GGATGGGTGC TGGTGCTGAT GCTGATGGCA 
AAATCCGCAA TGATAGATGG GTATCCGATC AAGGATGCTA CGCATATCGC ACTCGAGACA 
ACTCGTCAGT TCTTGGAACA AGATGACTCT GTACGTCGTC TCTGTTTCCC AAACCGCACT 
GACTTACATA CTGGACTGGA CCCCACCATA GATTACAAGA GTAATCTACG TCGTGTTTTC 
AAAAAGGGAT GAAGATGTCT ATCGGGAGAT TATCCCACAG TATTTCCCTC CTGATCCCGA 
ACATGGGCAT GGAAGTGTGT AAATAAATAA AAAGGTAACG ATAAAAAGAA AAGGTAACGA 
TGGCCGTGAT GGGAATGGAA AATGCATATC CTTTAGCACC AAAAGATGGG TACAACCACT 
AAAACTCTGA TATACA

Protein sequence

MISDGDLQSS LKIRSRYNGH YSCMTLPRLA SRLAKTMTPA DIPTLSQLYR HDHTNALNPT 
KPKYEFTKQL NDRVSIWRGD ITELEADMIV NAANSSLLGG GGVDGAIHRA AGKHLLEECK 
KLGGAQTGET KFTAGYNLSS KKIAHTVGPV YHSHPPQRAA QLLKSCYQSS LEGCRDSGGG 
VIGFSSISTG VYGYPIKDAT HIALETTRQF LEQDDSITRV IYVVFSKRDE DVYREIIPQY 
FPPDPEHGHG SV