Gene CNH02210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNH02210
Symbol
ID	3259091
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006693
Strand	+
Start bp	511648
End bp	513073
Gene Length	1426 bp
Protein Length	346 aa
Translation table
GC content	49%
IMG OID	638258266
Product	conserved hypothetical protein
Protein accession	XP_572564
Protein GI	58270816
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GGACAATCAA CCTAGCCTGC TGGCTATATC CAGGCTGGGA CAGACATTAA ATACAACCAC 
GGCTGCAACC TTTGGCACCA CAATGTCATG TCCCCTCCTT CCTCCAAGCA GCCCTTAACA 
CCTTCGTTAC AAATAAATCG AAAACCTTTG CCCAAATGGG AAAAAGTCTT GTGGAGAAGT 
CAGCCTTATC CTGACAACTA TGTGCCCCCT GACTTTTTGT CAGAGCTTAA TGATATACGT 
GAGTCTGTTT TTTTACGATA GATCTCAAGG CTACATAACT GAAATCCACG GTAGTACCCC 
GCCCACGCCC GCCTTTTTAC GCTCTGCTGT TAGCATGTCT CCCTATTTCA CAGCATATCT 
CTATTATTGC CATATTCCTT GCAATATTTG CTGCACTTTT AGAAGAAAGA GTTACTCCAG 
AAGCTGTGGG CTGGGGGTGC GTACTGGGTG GCATTAGTGG ATGGGCAATA TGGACGTGGG 
GTTGGGGCAG ATGGGGTCCT AAAGAGCCTC AAGGTCCATT GCTTTTTTTT CCTATGCAAT 
GATCAGTGCT GATAGTGCAG TAGATTCATT AATACCCACA CCAACTCCAC TTCGCACCCT 
TATACTACCC CCTCTCCTTC TTTCTTTGCT TTCCCCCGTG CTTGGAACCT TGACATCCGC 
GACAACTTCA GATTCAATCT GGCCTTTAGC CGGCGGCCTT GGGTTTGTGC ACCTCTTACT 
GGTGGATTTC AGGACAGGAG AAGATGTGAG GGTTGTGAGG AGACGTGAAA GGTTGAGAAA 
GCGACGGGGT AGTGTGGGCT TGAAGGAAAT CGGAGAGGAG AAAAGGTATG CATCACGATG 
CTCTGGGCCT GAGCGATGAG GCGCTGACAT TGAGGTAGCT TGACATCGTC GCTGTCACTA 
ACCTCGGCAC TTTCAGCATC TGTTGTGCTT GCTTCTCGTC TACCCTCAAC AGCCCATGTC 
TTTTCGTTGG TCCTGCTTGC CGTGTTGCTA TTTGCTGGCT GGCCAGTCAT AACAAAAAGT 
GTGCGCGTAA GTTTACCGCC GATCTCTCTT CAAGAGATGT AAGCTGAGAT CTTGATAGGA 
GACTGGTAGG GCATACTCTT TCGTACTGAC TGTATCAACA ACGACTCTCG CCCTATCACT 
TTTTCCTCCA ACCCCTTCTA CCTTTTCCGG CATCTACTTC GGGTACCTTC CGTCAACACC 
AACGCTAGTG TTTCTGTTAA TTCTTTTTCT CGTCAATTTC ATTGGACCTG CCATGCTCTG 
GTATGCTTGG CGATGGAAAG TCAGGCGAGG CGGCGGCTGG GATGTTGCGA CAGTTCGAAT 
TCGCCAGAGT CGGCCATGAT GGTGAGCGTT GTTGCTGCCG AGCTTTGCCC AGATGAATGC 
ATTGTTGATA GTGACATATG AGAAGTGAAT ATGCATGCGT ACAACC

Protein sequence

MSPPSSKQPL TPSLQINRKP LPKWEKVLWR SQPYPDNYVP PDFLSELNDI LPRPRPPFYA 
LLLACLPISQ HISIIAIFLA IFAALLEERV TPEAVGWGCV LGGISGWAIW TWGWGRWGPK 
EPQDSLIPTP TPLRTLILPP LLLSLLSPVL GTLTSATTSD SIWPLAGGLG FVHLLLVDFR 
TGEDVRVVRR RERLRKRRGS VGLKEIGEEK SLTSSLSLTS ALSASVVLAS RLPSTAHVFS 
LVLLAVLLFA GWPVITKSVR ETGRAYSFVL TVSTTTLALS LFPPTPSTFS GIYFGYLPST 
PTLVFLLILF LVNFIGPAML WYAWRWKVRR GGGWDVATVR IRQSRP