Gene CNK00950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNK00950
Symbol
ID	3254413
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006680
Strand	+
Start bp	297631
End bp	299743
Gene Length	2113 bp
Protein Length	557 aa
Translation table
GC content	50%
IMG OID	638253585
Product	Pol II transcription elongation factor, putative
Protein accession	XP_567783
Protein GI	58260746
COG category	[B] Chromatin structure and dynamics [K] Transcription
COG ID	[COG1243] Histone acetyltransferase
TIGRFAM ID	[TIGR01211] histone acetyltransferase, ELP3 family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.110026
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGCAC CCACAACCTC ACAGTCGGAA CTGCACCTTC TATGTGTATC CGCCGTGGTC 
AGAGACCTCA TCTCAACCTA TAATTCCTCA AGCAGCTCCG CCACCCAGCC TCCAAACGTA 
AACAGTCTTC GAGCAAAATA CGCAAAAAAA TACGGACTCA AGGCAGTCCC TCGTTTGACA 
GATGTCCTCG CTGCTGTCCC TGAAGAATGG AAGGACAGGC TGAGGGGATG GCTGAGAGCA 
AAGCCAGTCA GGACGGCGAG CGGTGTGGCA GTTGTTGCTG TCATGTGCAA ACCCCATCGA 
TGTCCTCACG TAGCCATGAC CGGAAACATC TGCGTGTAAG TGTTTCTAGT GGCACTGATC 
TGTGATCGCT ACTTATAGAA TACGATAGCT ACTGCCCCGG CGGTCCCGAC TCTGACTTTG 
AATACTCAAC CCAGTCATAC ACTGGATATG AGGTACGTAC ATTCTGCTAC CCGCTTTGTG 
TGCCTCGTCT GACATTCTGA AGCCTACTTC TATGCGAGCC ATCCGGGCCA GATATGACCC 
ATATGAGCAA GCGCGTGGAC GTGTGAACCA GCTCCGTGAC CTTGGACACA GCGTCGACAA 
GGTTGAGATC ATGTACGTAG CTTTTCTTTT TCTTTTTTGG TTTTCAAAAG TTTTTCCGCT 
CACTGGATCA CAGTATCATG GGAGGAACGT TCATGTCCAT GCCGGAAGAC TACCGCCATA 
AATTCATTGC TGGACTTCAC AATGCCTTGA GTGGTCACAC TGGAGAGGAC GTTGACGAGG 
CTGTCAAGTA AGTCTATTTG CCAACTCAGC AAAAAGTTCG AGTAAACTAA TATACCACAG 
ATTCTCTGAG CAAAGCAAGG TCAAATGCGT TGGTATCACT ATTGAAACTC GTCCCGATTA 
CTGCTTGAAG CCTCATCTGA GTCAGATGTT GAGGTATGGA TGCACCCGTC TGGAAATCGG 
TGTTCAATCA GTCTATGAAG TGAGCCAACT CCATTTTTAC TCACCCCCTC CCCCCTCTCC 
CCACCAAAAA AAAAATCCAG CTGACACCCA GTCAAGGACG TGGCACGAGA CACCAACCGA 
GGACACACTG TCCGAGCTGT CAGTGAATCC TTCCACATGT CCAAAGACGC CGGCTACAAG 
ATTGTCGCCC ACATGATGCC TGACCTCCCC AACTGCGGTA CCGAGCGAGA CATTTGGCAA 
TTCCAAGAAT TCTTTGAAAA CCCCGCTTTC CGCTCAGACG GTCTCAAACT GTACCCAACC 
TTGGTCATCC GTGGTACCGG TCTTTACGAA CTGTGGAGGA CTGGCAAGTA CAAGAATTAC 
CCTCCCAACG CCCTTGTCGA TATCGTAGCG AGGATCATGG CGCTCGTACC CCCCTGGACG 
CGAGTCTACC GCGTCCAACG AGATATCCCG ATGCCGCTCG TCTCTTCCGG CGTGGAGAAT 
GGTAATTTAC GTGAACTCGC ACTTGCGCGT ATGAAGGATT TCGGTGCCGA GTGTCGAGAT 
GTGCGATACC GTGAGGTCGG TCTGCACGAG ATTCACCACC GTGTGCGACC GCGTGATATC 
GAGCTTATCC GAAGAGATTA CGCGGCGAAT GGCGGATGGG AGACGTTCTT GTCGTATGAG 
GATCCTCAGT CTGATATCTT GGTCGGTCTT TTGAGGTTGA GAAAGTGTTC AGAGGAAGGG 
ACGTTTAGGA AGGAGTTGGT TGGTATGCAA GGTGGATGCA GCCTTGTGCG AGAGCTGGTA 
GGTTTTTTTT ATTTTTTTAA TGGGGTTGAA GTATGGATAC TGATCCAAGG TTGATTAGCA 
CGTGTATGGT ACTGCTGCAC CCGTTCACTC TCGTGACCCC AAGAAATTCC AGCATCAAGG 
TATCGGTACA TTGTTGATGG AAGAGGCGGA GCGTATCGCC CGTGAGGAGC ACGGTAGCGG 
TCGGATCGCT GTAATCTCTG GTACGTATAC GAGCCAAACA GCTTTGCCGA ACAAGGATTT 
TATTGATAAT CATGTACACA CAGGTGTTGG AACGCGTGAT TACTATCGAC GGCTTGGTTA 
CTTTCTCGAT GGGCCTTATA TGGTCAAGGA TCTTTTGTAC GATGACGAGT AGATTTGAGC 
TTGTGATTTT TGA

Protein sequence

MIAPTTSQSE LHLLCVSAVV RDLISTYNSS SSSATQPPNV NSLRAKYAKK YGLKAVPRLT 
DVLAAVPEEW KDRLRGWLRA KPVRTASGVA VVAVMCKPHR CPHVAMTGNI CVYCPGGPDS 
DFEYSTQSYT GYEPTSMRAI RARYDPYEQA RGRVNQLRDL GHSVDKVEII IMGGTFMSMP 
EDYRHKFIAG LHNALSGHTG EDVDEAVKFS EQSKVKCVGI TIETRPDYCL KPHLSQMLRY 
GCTRLEIGVQ SVYEDVARDT NRGHTVRAVS ESFHMSKDAG YKIVAHMMPD LPNCGTERDI 
WQFQEFFENP AFRSDGLKLY PTLVIRGTGL YELWRTGKYK NYPPNALVDI VARIMALVPP 
WTRVYRVQRD IPMPLVSSGV ENGNLRELAL ARMKDFGAEC RDVRYREVGL HEIHHRVRPR 
DIELIRRDYA ANGGWETFLS YEDPQSDILV GLLRLRKCSE EGTFRKELVG MQGGCSLVRE 
LHVYGTAAPV HSRDPKKFQH QGIGTLLMEE AERIAREEHG SGRIAVISGV GTRDYYRRLG 
YFLDGPYMVK DLLYDDE