Gene CNE03230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNE03230
Symbol
ID	3257898
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006687
Strand	-
Start bp	917898
End bp	921237
Gene Length	3340 bp
Protein Length	986 aa
Translation table
GC content	50%
IMG OID	638256906
Product	hypothetical protein
Protein accession	XP_570880
Protein GI	58267448
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.922942
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TCGCCCTCCG TCCATCTTTC TCCCCCATCC ATGGGCACAA AAGCCCCCGG CCCTGACAAT 
GTTCTCTCCT GCAACCCCCA TAGCAGGCCC TTCAAATCCG TCCCATCTCC GCCCTTCCTT 
TTCTTCTCCT GCATTCCGCC GTGGGGGTTC AATCTTTCCT TACGAGTATG GAGCTAGTAA 
TCAACCATTT TCTCCTCATT ATTCTGCTCC ATTCACTACC ACAGGGGTAA GGATCAGGTC 
AGGTTCCGTT TTCAGTCGAG AGCAGTGGAA AAAAGAGGAG CTAGCTCGCC GACGACAAGA 
ATCAAGAGAC AAGCTCAAAT CAAGCTGGGA TTTATTGTTT GAGAAATATC GGGATGTCGA 
GGATGATGAC GAGATTGACC TGGCAACAGG AACAATAGTG AAGGATAGGG GCAAGCTGAG 
AGCTCTGCAA CAACCCATGT GGTTTGGACA AAAGGAAGGT GATGATGGAG AATCGACGGG 
AGGAGGAGGT CATGACTTCG AGTCGGACGA GGATGAGTTG GGAGACTGGG ATGAGAAGGC 
AGGTCTGGAC CCTCAACTTC CGGAATGGGA AGAAGTGGAA GGATTCCATC AAGCTTGGAC 
GGAGGAGGAT GATGCAGACT TCAGAGAATT CATGCGTGCG GAACAACGGC GAAAATCGAC 
CTTTGGATCG GATAACGAGG ACGAAGATTC TCTGTCTGAA CACGACTCGA AGAAACCTGC 
AGGCTTTGAA GAATATTTAG ATGTATCTCC AAGATCGCGG GGCACTCAGA TTCTTCCTCT 
TCCCACCTTA GATGACCTTT TCGCGTCGGA CAACAAGGCC TCTTCGGAGG ATGAGTTAGA 
AGCCATCAGC GATAGTGATG CGGAGGAGAA AGGTGTTCGA GATAATTTAT CAGCTTTATC 
AAGCTTGCAT GTGCGTGTGT TCGTAAAGAC ACCATGTTTC CGCAAACTGA CTTCCTATAG 
GGCACCCCTA TCGTATCACG GCGACCGAAA CGACGCACCA TCATCGAAGT GGTGATCCCA 
CCTCGTCCTC GATCCAAGTC AACCGGTGGC ATGGAGGAAA AACCTTCTGA GCACCATCTC 
TTGGATTGCG TTCCCAAGTC TATTTCGACT CCTACTCTTG CAGATCTTTT CACCCCACCT 
CCGGCTCGGA TACGTCGTTC ACTAAGTGGT TCTTCAGCGA CAAGTGGCTC TTCAGCATTA 
TCCAAGAGCA AAGGAAAAAA GCGCATGCCC GGCGAACGAC CAATGGAGGA TACATCATCT 
GGAAATCATT CGATTATTCA ACTCAGGAAA CCGTCAAACT CAACAGAGAC TATCAAAAGG 
TATGATGAAA AGCTTTTCAG ATGTGACAGC TGTCGTGCCG CTGGTGGCAC TAGAAAGGAT 
CAAGCTCCCT TCTGTCCAGG AAGGACTGAC AGCTGCATTT TTGAGGATTC ATCAGGGTCA 
TTCGAGCAGT TTGGTGCGTC TATCTTATGG AGTTCAAAAA ATGACACAAC TGATTATTCT 
GTGGGTTAGC ACGAAAATCG GCGACGCATA GTCGACCGTC AGGCAAGTCT TTTGCCGCTG 
ATACTCGGTT GGTCGAGGGG GCCGGGCCAA CCAAACAGAG GACATGTAGA CTTTGCCGAG 
AAGCAGGTGG GGAGAGAGCG AAGACGGCAG GAGTATGTCT GGGAAGACAT TCATACAGGC 
GGTGCAACTG GAGAAAGCGG GCAATCCATT CTTCGACTGC GAACACACAT ACAGTGACAC 
CTGTCGATGT CGCGAAGGGG GAGAGCAACC CCTCACAGGT TAATGTGTCA ACTGACACAC 
CCCAGCTGAG AACAAAACAT TCGCCTCTTC TCAACATGAA GGTTCCGTCC TTGAGATCAT 
CATCTGCGAT TAGAAAACAT AGGCGCCGTG TCATCGAATC CGTCAGTGAT GATGACGACC 
CCCGCTTTAC GACAGATACC GCACTACCGC CCCGCGAGCC TTCTAGCAAC TTCATTCGCA 
AGCCCCAAGA AACGGCACCG CTCCCGTCAC CCCCTCCGAC GTCGTCTGTC GCGCCTTCAT 
CCCCACCCAT TGCCTCCCTT CATAAGCCGT CAAGATCCCC GCTGTTGTCA CTTCCACCTT 
CTTCACCTCC TCGTCCCGAT ATCTTTTCCC CTGTTCCCAC TCAAGCTGCA CGTCCTACTC 
CTTCGCCATC CGTTTCATTA ACACATCCGA TATCAAGCAA TTATGTCACA GACGCCTACA 
AGCAGACCGG GGTTATGTAT CACCCAACTC CGCCCCCGTC TACTGACGGT ATGCGAAGTG 
CATCTTTGTC CAGCGACAAT GTTGCTACCT CGCTTCCTCA TAAGAGTGCT CTACGACGTC 
CATCAGACAC TCTTGGGCTT CAGTCATCCT CGTCTAGCAT TAAACGTACC CGTTTTTCCC 
TCATTCGTTC TCCCATGCGT CACCCATCTT CTGATGAAGA GGGTAGTGAA GACGAACTGG 
ATTTACTGTC AAATATTGAT TCATCATCTA TCATAGCCTG TTCATCGTCT CCGAAACACA 
GTTCTAGCCC TATTAGGACT GAGTGGAGCG TGAGGGCCGC AGATGTCGGA ATCAAACTAG 
GGCCGGAGCA TACAGGCCGA CTGCCGTCAG ATATGGTAAA AACGCTTGTG CCATCAATGG 
GCTTGTTTAG GCCGACTTTA GGCTCATCAT CTCAAGCAAG CTCCAAATAT ACGCTTCCCA 
CTCCTCCATC GAGCTATAGG CCTTCTCAGC CTCGTCCAGT ATCCGACCCA CAAAATCCAT 
CGTCTGGCAG TGGTGGTAAC CCACAGGCAC GGCTCATGCT CCCTCCCCCG CTTCCTGCCA 
AACGTTCGAC CCATCCAAAT TCACTGTCTA CTCCTAAAGA ACTCAAGAAT TCAACTAGCA 
CATTTTCAAC ATCCTCACCT GCTCCTTCAC ATATTAGATT AACTTCTTTG CCGGCTGTAG 
TCGTTCGCGC TCGAGCAAGG TCGCGAAGTC TTTCAATGGC GCCGCCCGGT GCCTTGCGAA 
CACCAAAAGC ACAGCGGTCT ATAATGTCAC CTGGCTCTAA GATTCCAAAG ACGGCACCTA 
CCAGGAAGGG TAAAGTTTTG ATGGATTTAC AAAGGGTAGC AAAGGAAATT GGTGACGAGG 
CTGGGCTCGA GTGGGGTCTT GATGAAGAAA CTGACGATGG CGGGAGAATG TGGAGGGAGG 
GCAGTGTTGC TGCGTATAAA TGACCGGCCA GTGACTTTGG ACGCATAGGC AGAAGATGGA 
GCGATGAGTG GAAAAAAAGC TCTTCTGAAG AGCTAGCTGG ATTTGAGTAT AGTGTAATAA 
TAATAATAAT GTTGTCATAC ATGGTTGTAT AAAAGTACTA

Protein sequence

MFSPATPIAG PSNPSHLRPS FSSPAFRRGG SIFPYEYGAS NQPFSPHYSA PFTTTGVRIR 
SGSVFSREQW KKEELARRRQ ESRDKLKSSW DLLFEKYRDV EDDDEIDLAT GTIVKDRGKL 
RALQQPMWFG QKEGDDGEST GGGGHDFESD EDELGDWDEK AGLDPQLPEW EEVEGFHQAW 
TEEDDADFRE FMRAEQRRKS TFGSDNEDED SLSEHDSKKP AGFEEYLDVS PRSRGTQILP 
LPTLDDLFAS DNKASSEDEL EAISDSDAEE KGVRDNLSAL SSLHGTPIVS RRPKRRTIIE 
VVIPPRPRSK STGGMEEKPS EHHLLDCVPK SISTPTLADL FTPPPARIRR SLSGSSATSG 
SSALSKSKGK KRMPGERPME DTSSGNHSII QLRKPSNSTE TIKRYDEKLF RCDSCRAAGG 
TRKDQAPFCP GRTDSCIFED SSGSFEQFAR KSATHSRPSG KSFAADTRLV EGAGPTKQRT 
CRLCREAGGE RAKTAGVCLG RHSYRRCNWR KRAIHSSTAN THTVTPVDVA KGESNPSQVN 
VSTDTPQLRT KHSPLLNMKV PSLRSSSAIR KHRRRVIESV SDDDDPRFTT DTALPPREPS 
SNFIRKPQET APLPSPPPTS SVAPSSPPIA SLHKPSRSPL LSLPPSSPPR PDIFSPVPTQ 
AARPTPSPSV SLTHPISSNY VTDAYKQTGV MYHPTPPPST DDTLGLQSSS SSIKRTRFSL 
IRSPMRHPSS DEEGSEDELD LLSNIDSSSI IACSSSPKHS SSPIRTEWSV RAADVGIKLG 
PEHTGRLPSD MVKTLVPSMG LFRPTLGSSS QASSKYTLPT PPSSYRPSQP RPVSDPQNPS 
SGSGGNPQAR LMLPPPLPAK RSTHPNSLST PKELKNSTST FSTSSPAPSH IRLTSLPAVV 
VRARARSRSL SMAPPGALRT PKAQRSIMSP GSKIPKTAPT RKGKVLMDLQ RVAKEIGDEA 
GLEWGLDEET DDGGRMWREG SVAAYK