Gene CNI04150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNI04150
Symbol
ID	3259627
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006694
Strand	-
Start bp	1100841
End bp	1102685
Gene Length	1845 bp
Protein Length	473 aa
Translation table
GC content	49%
IMG OID	638258910
Product	cytosine-purine permease, putative
Protein accession	XP_572604
Protein GI	58270896
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1457] Purine-cytosine permease and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.240841
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATATTC TGGTAGAGCA CGGTGTAGAA GAACGGGGTA TTGATCCTAG ACCAGAAAAT 
GTGAGGCATT TGACATGATG TCCCCGTTCA AGATGCTGAT CCACGCAGGA ACGGGACGAG 
TTGAACAAAT GGACCTATTT GCCACAATTC ACCCTTTGGG CTGCTTGGAA CACCAACATT 
CTATCAGTAT GTCTGCCGCT CAAACGTCAA TAGCTGCTCT AACCGCGCTC TTCAGTTTTC 
AGAGGGTGTC ATCGGACCTT CGTTGTTTGG CCTTGACTGG AAAACCAGCT GCCTGTGCAT 
TGTGTTTTTT ACGGCGGCCT CCGCGCTGCC GGTTGCCTAC TGTGCAACCA ATGGTCCCAA 
GACGGGTATG AGGCAAATGG TGCAAGCTCG TTACGGTATG GGGTAGGTCC TATTCTTTTT 
CAATGAAGGA TATTGGCTGA CACATATGTC ACAGCTATGG CTTGGCTCTT ATCTATGGTA 
TACTCAACTG CGCCACCATG ATCGGCTTCA TGGCTCTCAC TGCTATCCTT GCTGGACAGT 
GTCTCGCCTT GGCTTCTAAC TCTACCATGA GCTGGGATGT CGGAATTGTT ATTGCTGCTC 
TCATCGCTCT CATCGTACGT AAATTACATT CCTCTTGTCT ATCGCAGCAT TAACCCATTT 
TTCCCCTAGC TTTCGTTTGT CGGACTCAAC GCTTTACACA TTGTTTCCCT TGCCTCTTTC 
CCTGTCATGG TCATCCTCTA TGTCGTGCTT GCAGGTGTTG TTGGTGACAA ACTTCACCTC 
GTCCAGTCCG ATGTGGCCAA GGCTGCGACC GCCGTGACAG CTAGCGGTGT TTTGGGTTAT 
GGTGCCAGTT TGATCGGTTT TTCTATCACA TATACCAGTT TAGCTAGTGA CTTTGTAGGT 
CTCAAGGTCC ATTATTGCCC AAGCGTCGCT AATCAGTTTT GGTCTGAAGA CAACCAGCTT 
GCCTCCCCAG ACTCCAGGTT GGAAGCTTTT CCTCTGTGTC TATGTTGGCA TGGTTGTCCC 
TATGATCCTT TGCCAGATGT TCGGTGCCGC CTGTCAGCTC GCAGCGTACT CCATCCCCGA 
CTGGGAAACA GCGTCCAACG TTGGTGTCCC TAATCTCATC TATACCATGA CTGGCAACGG 
TAACGGCGCA TCTCGATTCG TGATGGTACT TTTCAGTCTG AGTGTTGTCG CCAATACCGC 
TCCTACTATT TACAGCGCCG GTCTCAGTGG TCAGGTCGCT ATCCCATGGC TTGTCCGAGG 
TGCGTAATTT CACCCCTCAA ATTATTAACT GCTGTCTAAC CATCTCCTTA TAGTGCCTCG 
ATACTTCCTC GCTCTCGTCG TATCTGCCAT CTACCTCCCC ATCGCCATCT GCGGCGCATC 
CAAGTTCTAT TCCGCCTTGG AAAATTTTTC ATCTGTCCTT TCCTACTGGA GTGCATTGTA 
CATCCCTCCG ACACTTATCG AGCCCATCCT CTTCCGAGGA CCAGTGAGTA GGAAAACTTA 
TCCTGTGGAG ATCTGGAATC AGATTGGAAA GTTGCCAATC GGACTTGCCG CCATTTTCGC 
CGCCATCTGT GTGAGTAAAG CTGTCATTTG TGGAAAGTGG CTGCGAACTG ATCGGATAAT 
ATAGGGTATC CCTGTGGTGA CCGGTGGTAT GGCTCAGAGT TGGTGGACTG GATGGATTGC 
TAGGAAGATT GAGGGAACGT GGGTACCCTT TCTAGAAGGT AGTTGTTATG CAAGGAAGCT 
GACATCTTCA TTAGCGGCGA TATTGCGTTC GAGATTGGTT TCGTCGTCGT CGGTCTCATC 
TACATCCCTG CTCGTTATCT CGAGAGGAAA TTTACCGGTC GATAA

Protein sequence

MDILVEHGVE ERGIDPRPEN ERDELNKWTY LPQFTLWAAW NTNILSFSEG VIGPSLFGLD 
WKTSCLCIVF FTAASALPVA YCATNGPKTG MRQMVQARYG MGYGLALIYG ILNCATMIGF 
MALTAILAGQ CLALASNSTM SWDVGIVIAA LIALILSFVG LNALHIVSLA SFPVMVILYV 
VLAGVVGDKL HLVQSDVAKA ATAVTASGVL GYGASLIGFS ITYTSLASDF TTSLPPQTPG 
WKLFLCVYVG MVVPMILCQM FGAACQLAAY SIPDWETASN VGVPNLIYTM TGNGNGASRF 
VMVLFSLSVV ANTAPTIYSA GLSGQVAIPW LVRVPRYFLA LVVSAIYLPI AICGASKFYS 
ALENFSSVLS YWSALYIPPT LIEPILFRGP VSRKTYPVEI WNQIGKLPIG LAAIFAAICG 
IPVVTGGMAQ SWWTGWIARK IEGTGDIAFE IGFVVVGLIY IPARYLERKF TGR