Gene CNL05100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNL05100
Symbol
ID	3254999
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006681
Strand	-
Start bp	430547
End bp	431802
Gene Length	1256 bp
Protein Length	286 aa
Translation table
GC content	47%
IMG OID	638253983
Product	conserved hypothetical protein
Protein accession	XP_568227
Protein GI	58261634
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GGTATATGAG CGCAAGTAGT ATCCAATGGG ATCCCTCAAA CGGAGGGCAG TGGACTACTG 
ATAGCAATGG GTTTATAATG CAGTAAGTTC TGGGGGTCAC TTGGTCCCTC AAAACTCCAG 
TCCTTGCTAA TTCAAGCTCC TACCCTTTTT ACAGGATTGT CTGCTTGATT ATCGGCCCCA 
CATTCTTTTC GGCAGCCAAC TATATCATTC TCGGAAGGTA TGTGCTTTCT TTCTGTGTGC 
TTGGAGCCTT GGAGGGCTGA TGATGGAGAA TAACCAGAGT GGTACGCAGA ACTGGGTAAG 
AATCTTAAAC CTATAAGTAT GATTGTGCCC TAACCACTTT TGCCCGATAC TCTGCAGGTC 
CAATTACTCT TCCATCACAC CCTCGTCTTT CTCCGTCATG TTTACGATCA CGGACTTCTT 
TTGTCTGTTG GTTCAATGTG CAGGAGGCGG CCTGGTTGGA ACCGCCGATA CCGACTCTGG 
CATGCAAAAC GGGTTGTATG TGATGGCCGC TGGTGTGCTC GCTCAGCGTA AGGACCTTTT 
CCTTTGCACT GCGCGGGCCT TTGAGCAGCG TACTGATGAT GACTATAGTT GCTGTCACTT 
TGGCTTATAT CTTCATGCTC AGCGAATTTA TCTATCGCCA TGCCAGATCC AAGAAAGCAT 
CTCGGCAGTA CGACTTACTT GCATGGGCCA AGATCTGCTG TTGTTGCTGC AGTAAACGCA 
AGCGCCAAAG TGTCGACTCG AGCCACCGAA TGGACGATGC GAATAAGACA GAGGCGGGGT 
TTACAGCTTC GAATGAGGGT GAACAAGAAG GTGAAGATAG GAAATTTGTC AATTTGGTCC 
TCTGCACCTT GATAGTGGCT ACAGTCCTCA TCGTCGTCCG GTACGTACTT TGCCAATTTG 
CTCTCGAGAC GCTCTTACAT TTGTTTTTCA CCCGCAGATC TGTCTACCGT TGCATTGAGA 
TGCTCAACTT TCAGCCTAAT CACCCTGGTG CTTATGGGGA CCAAACACTT TTCTTAGTTT 
TGGATTCTGC GTTCATGGTG AGTAGATGGA ATTAGCGAAA AGGGAAAGAT TGCGGCTGAT 
GGGCTTCTTG AGCTTGCTCT TCTTATTGTG TACGCTTTAA TACACCCTGG GTGGATTTTG 
GCTAGGACCT TAGGATTAAG CCGCCCTGTT GTATAGTGCT GGGATAGTTT GCGCAGGATT 
AAAAACTGGT CACAGGTTTG ATGAAATTAG GATGGATTTA GACGCATTAA GCTAGA

Protein sequence

MSASSIQWDP SNGGQWTTDS NGFIMQIVCL IIGPTFFSAA NYIILGRVVR RTGSNYSSIT 
PSSFSVMFTI TDFFCLLVQC AGGGLVGTAD TDSGMQNGLY VMAAGVLAQL AVTLAYIFML 
SEFIYRHARS KKASRQYDLL AWAKICCCCC SKRKRQSVDS SHRMDDANKT EAGFTASNEG 
EQEGEDRKFV NLVLCTLIVA TVLIVVRYVL CQFALETLLH LFFTRRSVYR CIEMLNFQPN 
HPGAYGDQTL FLVLDSAFML ALLIVYALIH PGWILARTLG LSRPVV