Gene CNG04150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNG04150
Symbol
ID	3258641
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006692
Strand	-
Start bp	1170306
End bp	1171910
Gene Length	1605 bp
Protein Length	457 aa
Translation table
GC content	54%
IMG OID	638258038
Product	conserved hypothetical protein
Protein accession	XP_572169
Protein GI	58270026
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG5071] 26S proteasome regulatory complex component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.161996
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CAGTTCTCAA GGCATACGAT GGACATTACA GCAGCCCTCC ACGAAGCCTC TTCTCAACAA 
AACCAAAAAT TGCGCTCTCA AGCATACCTC TCTCTCCTCC AATCCCTCCT GCAACCACCA 
CTCACATCCG CATCCCCGCT TATCGCTTTC GGCACGCACT TCACGACGTC TAACACCGTC 
ATCATCATCG TCGGTCGTCG TATCCTCGGC GCATACCTTG TCGCCCTTCT ATCAGGGACA 
ACAGTGGTGC AAAAGGGGAC TGCCAAGGTC CCCCTGGATG AAGAGGGGCA AGCTGACGAA 
GCAGAGTGGG CAGCGCTTGG GAAAGCGGCA TTTGGTGGGG AGAAGGGCGA AGAGGTGAGG 
AGGGATGTTG TTGAAGGCGT GCTGGCTGCT GGCTCTAGTG GGTGGTGCGA TGAGCAGGTG 
AGTATCATGG CTGGGCGAGC AGTCCACGTC CACGGGCTGA CATAACCGTG GCATAGATAA 
CTGTCCTGCG ACATCTACAC TCGCACCTCC TCATGCTTGA AGAAGACTGG GAAGGTGCTG 
CTCGAGCACT GATGCCGATG CAACTAGAGG GTGGTTCAAG AGTTGTATCC GACGATGAGA 
AGCTCAATGT GTACATGCAA ATCGTCCGCC TCTTCCTCGA GGTAAGCTTC CTCGTCCATT 
CTATCGCTGG GCTTTCAACT CACACCTCAA CACCTAACTC AGTGCGGCGA ATGGGGCCAA 
GCCCAAACAT ACTTTACCCG CGCTTCCCTC TTACCCCGCC CAACAGATAA GGAGACCCGC 
CTATCTATGC GTCTCTCTCA AGCTAAACTA TACGATTTTG CCAACGAATT CGCCAAAGCG 
TCTGTCACTT ACCACGAAGT CTCGCACGAC CCTTCCATCG ATCCTTCCGA CCGACTCATT 
ATCCTCTCCG CCGCTGTCAC CACCTCTATC CTCGCCCCTT CTGGCCCCCA CCGCTCTCGG 
ATCCTCGCTA CGCTCAACCG TGATGACCGG GTACACACCG AGCTGCCCGC CGGGTTGGGC 
ACAATGTTGA AGAAGATGCT TCTGGAGTAT ATCGTGAAAC CGGAGGAGAT GAAAGAGTTT 
GAGGGGGCAT TAGCACCACA TCAGCGAGCG GTCGTAGAAG GCGGTGGGAC AGTCTTGGAA 
AGAGCTGTAC GGGAACACAA CGTTGGTGCA TGTGCCAAAG TATACGACAA CATCTCCTTC 
TCCGCCCTCG GTGCGATTCT CAACCTCTCT CCGTCTTCAG CCGAGACGAT CGCTCAGCGT 
ATGATTGAGC AATCCCGTCT TCGCGCATGG ATTGACCAGC CTTCCCAACT CATCTTTTTT 
GAATCCCGTC CGCAGCTTGA TACCGACGCA GACGCCCAGG GCACGGCGGG CGGGTTAGGG 
GTGGAGAAGG AGGAGAAGGA GGTGGAGAAG GTAGGATGGG GTGTAAGGTG GGATGAGAGG 
ATTAGAGGCA CGAGTTTGAG AGTGGAAGGG ATTGCAGAGG CGATCTTGGC AAAAGGTTTG 
ATCGATGCGT AATCGGGATT GCTCACGCGG AGACTGCACG TAGAGGGAGT GAAATGTAGA 
TTAAACAGAA AAAGAACATT GTATGTACGT ATATATCTAC GCTTC

Protein sequence

MDITAALHEA SSQQNQKLRS QAYLSLLQSL LQPPLTSASP LIAFGTHFTT SNTVIIIVGR 
RILGAYLVAL LSGTTVVQKG TAKVPLDEEG QADEAEWAAL GKAAFGGEKG EEVRRDVVEG 
VLAAGSSGWC DEQITVLRHL HSHLLMLEED WEGAARALMP MQLEGGSRVV SDDEKLNVYM 
QIVRLFLECG EWGQAQTYFT RASLLPRPTD KETRLSMRLS QAKLYDFANE FAKASVTYHE 
VSHDPSIDPS DRLIILSAAV TTSILAPSGP HRSRILATLN RDDRVHTELP AGLGTMLKKM 
LLEYIVKPEE MKEFEGALAP HQRAVVEGGG TVLERAVREH NVGACAKVYD NISFSALGAI 
LNLSPSSAET IAQRMIEQSR LRAWIDQPSQ LIFFESRPQL DTDADAQGTA GGLGVEKEEK 
EVEKVGWGVR WDERIRGTSL RVEGIAEAIL AKGLIDA