Gene CNL06300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNL06300
Symbol
ID	3254783
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006681
Strand	-
Start bp	743907
End bp	744955
Gene Length	1049 bp
Protein Length	191 aa
Translation table
GC content	57%
IMG OID	638254105
Product	gal4 DNA-binding enhancer protein 2, putative
Protein accession	XP_568154
Protein GI	58261488
COG category	[K] Transcription
COG ID	[COG1308] Transcription factor homologous to NACalpha-BTF3
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.918528
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CCCCACCGCA CACACCGCCA TGTCCATCGA GAACCTCCAC ATCGCTGACG AGACCGAAAT 
CCCCGCCGGC GCCACCGTCG AGCTCCACTC CCGCCCCGAG CGCAAGGCCA GGAAGGCTCT 
CGAAGGGCTC GGCCTCAAGC GCGTCCAGGG CATCCAGCGA GTCACCCTCC GACGAGCCCG 
CAACGTCCTC CTTGTCGTTT CTAGCCCCGA AGTCTACAAG TCCCCCGGAA GCGACTGCTA 
CATCGTCTTT GGAGAGGCCA AGGTGGAGGA CCCCAACAGT GCGGCGCAGT TGCAGGCGCA 
GGCTCAGTTG GCTGCCAGTA GCCAGGCCGC CCAGCAGGCT CATGCCCACG GAGGGTTCAA 
GGAGGGTGTG CCCAAGTCTT TGGAGGAGTT GATGCAGGAT GCGTAAGTCC CGAACGAGCG 
AGCCGAACGT CCCGGACGGA GCGGAGGTGA TGGGTGATGG ATTGGCGGAT GGATGGATGG 
ATGGATGGAT GGGGCCGAGC GCAGCGAGAT GTGGTCATCA CTAACGCTTC CTCTTAGGCC 
CTCCACCGAC TCTTCCGCCC CTGCCCCCTC TGGCGAGGCT ACCGACGCTT CCGCTTCTGG 
CGACTTCAAG GTCTCTGACG AAGAGATTCA ACTCATCGTC GCCCAGACTG GTGTGGACGA 
AGCCAAGGCT CGAGAGGCGT ACATCTCTGA AAAGGGTGAC TTGATCAATG CTAGTATGTT 
AAAGTTCTTC CGTCCTTCCT TCTTCCTTGC TCCCTCCTTC ATCTTTCATT CTCAAGTTCC 
CTACTTCCTA CCTGCTGTAG AAAGAGTTAG CGCTGACCTT TTCTCTTCCC TTGATATCCA 
GTCATGAAGC TCCAATAAGC CACATCTCAG CAGCAGTAGA GTCAGTGTCA CGGAGCGGAC 
GAGAAGTCAG AGTTGGAGAA AAAGGGGGAA TGGGGGGTTG TAAAAACCGA GGGAGGAGGC 
TCTGTGTAAT TTTTGAATAC TCAGCAGGGA GCGGATGGCG AGTAGGAGAG AGAAACAAAA 
CAGGCATGAA TCCAAAAAAA TGCTTTGCT

Protein sequence

MSIENLHIAD ETEIPAGATV ELHSRPERKA RKALEGLGLK RVQGIQRVTL RRARNVLLVV 
SSPEVYKSPG SDCYIVFGEA KVEDPNSAAQ LQAQAQLAAS SQAAQQAHAH GGFKEGVPKS 
LEELMQDAPS TDSSAPAPSG EATDASASGD FKVSDEEIQL IVAQTGVDEA KAREAYISEK 
GDLINAIMKL Q