Gene CNC05330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNC05330
Symbol
ID	3256204
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006685
Strand	+
Start bp	1592986
End bp	1594360
Gene Length	1375 bp
Protein Length	186 aa
Translation table
GC content	47%
IMG OID	638255751
Product	histone H1, putative
Protein accession	XP_569727
Protein GI	58265142
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CAACTCTCAA CTTTTATTTT TTCAAGGTAA GCTGACGTCT CTTTCGTCTG CCAAAGGTTT 
ATAAATGCGC CAGACTACTT CTCCCTGTGA CTAGAAAGGC GACGCTAACA AATCCTTTCC 
TTTTCATTGC CATCTCTTCC CCTATCAGCC ATTTGCCACT TCTCACAAAC AACTGTCATA 
CTTGAATCAT CATGGCCCCT GTCAAGAAGA CTGCTGCTCC TCCCAGGAAG GCTACTACTC 
ACCCAACTTT CCTCTCTATG ATCCAAGTAA GTTCATGTTT TGTCATTCGT GTATGGTTAA 
GATTCTTTCC CACGAGATTG CGGGCATGTC TACATTTTGG CCCTTCACTG GTCCATCCTA 
ATAGGAGTGG CAAAACGGCC TTTGAATGGC TGTTAATCGT CAATTGAGCC ATCTGGAGCG 
ACTCTTCGTC GCATCTTTGC TCGAATAATT ATGACATTCC CATGCGGGGC TGCACAGGCG 
ATCTTACCCG GTTACTTCCG CCGATGTAGA TCTCGCTTTG TTTTTGGTTA CCCAATGTAC 
AATGCCAAGC GGAGGGAAAG CATCAATGAT TTATTTTTCT ATCCAGTTCA AGGGTTACTG 
CTATTATGCG CAGTTCGCAT ATATGCATAC CCCACTGGCG ATAGATTTAA ATTTAAGGTG 
TATAGCCATA ATCTTTATTC TGCCTGGAAA GATAAAAAAA ATAGAAGGGC TTGTGCTGAT 
TACTTTCATC ACAGGAATGC ATCGCCCAGA ACAAAGGGGA TGCTCGAAAA GGTGTCTCTC 
GACCTACTAT CAAGAAGTAA GTCGATCACA GAGCTTAGTG GGTGTCACGT CTGACTGGAG 
GTTACAGATT CCTCGCCGAC AAGTACAAAC TCGACATGAG CTCCGCTGCC AACATCAGCA 
ACTTATCGAA CGCCATCAAG CGGGGTGCTG AAAAGGGCCA GCTTACTCTT CCTAGTGGGA 
TTGCTGGTCG AGTGAAGGCC GGTGCCAAAG TTAGTAAAGT TGCATTATCA GTTTCTGGAA 
CATGCACTGA CTTATCTTGC AGAAGCCTGC TCTTGTTCAC AAGAAGTCGT CTGCTGGCAA 
GGAGAACGTT GCTCCTAAGA AAGCTGCAAG TACCGAGACT AGAAAGCACG CAGTTAGGAA 
GGGTGTTACT GCTCCCGCTG CCATCAAGGC CGTTCCCACG AAGAAGCCTG TGGTGAAGAA 
GGTCGCTCCT GCTGTCAAAA AGACTTCCGC CTCTAAGAAA GTTCATACGC GTGAGTTATT 
ACCGTTTGCC GAGTGTGTAT CCATGTTGAA CATTGTTATA GCCAAGGGCG CTGTTGTTGT 
CCCTGAAAAG GCCGCCCCTA GGAAGAAGGC TGCTCCCAAG AAGGCAGCCG CCTAA

Protein sequence

MAPVKKTAAP PRKATTHPTF LSMIQECIAQ NKGDARKGVS RPTIKKFLAD KYKLDMSSAA 
NISNLSNAIK RGAEKGQLTL PSGIAGRVKA GAKKPALVHK KSSAGKENVA PKKAASTETR 
KHAVRKGVTA PAAIKAVPTK KPVVKKVAPA VKKTSASKKV HTPKGAVVVP EKAAPRKKAA 
PKKAAA