Gene CNL04010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNL04010
Symbol
ID	3254887
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006681
Strand	-
Start bp	97624
End bp	98894
Gene Length	1271 bp
Protein Length	382 aa
Translation table
GC content	51%
IMG OID	638253873
Product	hypothetical protein
Protein accession	XP_567956
Protein GI	58261092
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.558936
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACAGTG ACGCCGAGGT TATTCTTTCT ACGGATGAGG TTCTGAAATT ATTTGGGACT 
ATTCAGACAG CTGTTGATGC AACTACTTCT TCTTCTGTTC CATTATTAAA CAAGTGAGCT 
TGTCTCGCTT TTAAGTCTAT GCTGCAAGAC AGCTGATAAG CTTCTTTAGA GTCCAAAACA 
AAGAGGAGGA TCTTGATTTT GCCAATGGTC TTTCCCTTCT CAATCTCCGC CCTCACCTCC 
TCTTGTCATC CCTTCACCAA CTCGTTATCC TGCTTGCTTT ACGGTTGACA TCCTCAACAG 
AGGCTGCTCC CGATCCATCC ACTTCCACAG CCCTTTCCAT CCCTTTTCCG AACCCCCGTT 
CACGACCGGA ACTCACAGAT GATAATGTGT TGAATGAGAT CGCGGGAGAG TTGGTAATGA 
ACCAAGAAGT TATGGACAAA GTGAGAGGGC TGGAGAACAA GTTGGAGTAC CAGATTAAGA 
AGTTGATCGG GCTTGCCGAG GCTGAAGATA AGAGGGGCAA GGATGTTGTC GAAGACGTTG 
AAGAAGGTGA GTTTGTCTAA TTGTCTGTGC AAGAGCAAAA AAATTAAAAA AAATTAACTT 
GCCCATCTAC AGATCCATTA TCATTCCGAC CCAATCCATC TGCTATTACC TCCCGGACAT 
CTCCCAAGGC CGCCCGCGGC GGATCCCCTA CTGGTTCAGA CGACGAGAAA TCCGGAGTCT 
ACCGTCCCCC GCGTGTCGCT GCTGTCCCCT ATTCCGAAGC TGCTCCCCAG GGCCGCGAAA 
GAGAACGCCG TGCTCCCGCA CTCCTGTCCG AGTTCGCCGC CACCATGGAC TCTGCGCCCT 
TACTTGAATC TACCTCTGGT CTCTCCGTTC GTCCGGTCAC GTCTGCTGCT GCCAAGTATT 
CCAACTCTGT CAGCGCTAAG CGTGCTGCAG AGTTGAAGAG GATCGACGAA TTCGAAGAAG 
AGAACATGAC TCGATTGGTA ACCAGCAAGA GGGAAGCCAA GAGAAGAAGA GATGATGAGG 
CTGCTTTGGC AATGGGCTTC GGTGTTGGGC CAAGCAGAGG TAGAAGAGGA AGAAATGGTT 
TGGAGGCAGA ATTGGAAGGG GTGCTCGGAG ACAGAGGAGA CAAGGGAGTC TGGGATGGTG 
TTTCGGGCAA GTTTGGCCAG AGGGGAGATG CTTTGGAGCG AGGGAAGAAG AGGGTCAGCG 
GCACTGGCTC TACGAGCGGC AAGGCCAAAA AGGCTAGGTT TGAGAAGGAG CTTGCCAGGA 
AGCGCAAGTA A

Protein sequence

MDSDAEVILS TDEVLKLFGT IQTAVDATTS SSVPLLNKVQ NKEEDLDFAN GLSLLNLRPH 
LLLSSLHQLV ILLALRLTSS TEAAPDPSTS TALSIPFPNP RSRPELTDDN VLNEIAGELV 
MNQEVMDKVR GLENKLEYQI KKLIGLAEAE DKRGKDVVED VEEDPLSFRP NPSAITSRTS 
PKAARGGSPT GSDDEKSGVY RPPRVAAVPY SEAAPQGRER ERRAPALLSE FAATMDSAPL 
LESTSGLSVR PVTSAAAKYS NSVSAKRAAE LKRIDEFEEE NMTRLVTSKR EAKRRRDDEA 
ALAMGFGVGP SRGRRGRNGL EAELEGVLGD RGDKGVWDGV SGKFGQRGDA LERGKKRVSG 
TGSTSGKAKK ARFEKELARK RK