Gene CNL04200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNL04200
Symbol
ID	3254732
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006681
Strand	-
Start bp	159696
End bp	160910
Gene Length	1215 bp
Protein Length	366 aa
Translation table
GC content	52%
IMG OID	638253891
Product	hypothetical protein
Protein accession	XP_567973
Protein GI	58261126
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.290426
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCCTA AAAGGCAGAA CGAGAACGAG AATCAAGCGT CTGAGGCGAC TCAGAAGAAG 
CAGCGAAACT CCAACAAGCA ATGGGCGACA GATACCAACA GCGATGGTGT CTCGGCAGAG 
GAGCACGTTG CTGTATGGTT GTCAACCATT CCTGAGAATG GAAGGCTCCC CAACTTTCAT 
AACTGGAAAA CTGGTCATGA GAAGAAGGAT TTTTGGTCGA GAAAGTGTCT ACAGTACCTT 
ACTGACAATG GCTGCGACAG TCGACGCCAG TTTCAAAGTG TTGCTCTCAA AGTAAATATG 
TCTTTTTCGT TTTTGGTATG CTCATGAGCG CTGATATGAT GAAAGATCAA TCAAATTGTC 
GAGAGCTTCA CTAAGGCATC CCAGATAGGG ACCGGGACTG GTGCTGGGGC GATGGAGATC 
GACGACGAGA GTCTCCTTGG TGTGTAAAAG TACTTTGGCA GGCAGCATGG GCACGTCGTG 
GCTAACTGAA CATTAATAGC TCAACGAAAG AAGGTTTGCC CCTTCTACGA GATCCTTTTA 
CCTGTCCTTG GCGACAGGGC CTCCGTCACT GCCCACCACG CCTCTTCGAC CCTCCACGCC 
TCTCTCAATC GTCCCGACAG AGATCTCGCT GCCCTCGATG GTTTGATAGA GCGCCAAAGG 
GGCGAAATGG CTGCTGATGA CTCGGAAGAT GAGTTGTCAG GAGAGGATGG TGGTCTCTTT 
GGGGACGGTG CAGGTGAGGC TAGCGAGACC GAGTCAGAGG CAGATGCTCC AATCATTGCA 
GCTATCCGCA GGGAGAGCCG CTCTTCGTCT CAACCTGCAC GGTCCTCATC TGTGCTGGGC 
TCAGTGTCTA CACCAATCCG AGCCCAAACC CAGAGCCAGA GAGCATCCAT AAGGTCTTCC 
AAGGCAAAGG CTGTCTCGGC AGATGACAAG ATGGATGAGC TGGTCATGAG GCAGGAGGGC 
AACGACGATC GGCGGCATCA GGAGCTATTG GCCGTTCAAG AACGGAAAAT CTCCGTGCAG 
GAGAAACATC ATGCAGACAT GATGAATATC GCGCAGGAGA ATGTGACGAT AGCACGGGAG 
AATGCGGCGA CAGAAAAGAT GAAGATGTTG GCGGAGAGTT GGAACAGGAA GATGGAGATG 
CTGATGAGGT CTGGGAAAAG TTGGGAGGAG GCGAAAGTTA TGGTGGGGCC TGAGCCTGGA 
GCTCCCTCTC TATAA

Protein sequence

MPPKRQNENE NQASEATQKK QRNSNKQWAT DTNSDGVSAE EHVAVWLSTI PENGRLPNFH 
NWKTGHEKKD FWSRKCLQYL TDNGCDSRRQ FQSVALKINQ IVESFTKASQ IGTGTGAGAM 
EIDDESLLAQ RKKVCPFYEI LLPVLGDRAS VTAHHASSTL HASLNRPDRD LAALDGLIER 
QRGEMAADDS EDELSGEDGG LFGDGAGEAS ETESEADAPI IAAIRRESRS SSQPARSSSV 
LGSVSTPIRA QTQSQRASIR SSKAKAVSAD DKMDELVMRQ EGNDDRRHQE LLAVQERKIS 
VQEKHHADMM NIAQENVTIA RENAATEKMK MLAESWNRKM EMLMRSGKSW EEAKVMVGPE 
PGAPSL