Gene CNN01810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNN01810
Symbol
ID	3255364
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006683
Strand	+
Start bp	519715
End bp	522967
Gene Length	3253 bp
Protein Length	737 aa
Translation table
GC content	52%
IMG OID	638254599
Product	conserved hypothetical protein
Protein accession	XP_568686
Protein GI	58262552
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATTCTTAGAC CGTTTTCGCT CCTCCTTTCC CCTCACCGAT TTGCTTACCT CGCAAACTCG 
CAGTGTGTTT TGGCAGTGCG CTTTGAGCTT GTGCTCCACA GCTTCTCTCT TCTCTTGTGC 
TCACCCTCTC CTTCCCCCCC CCCTCACTTC CACCTGGCCT TCCTTGCGCT CACGTCTTTT 
TTCAGCCCAA ACAGGCAACG CTGCGACTCG TTCCTGCCGC TGCATTGGCT CGCTAACAGG 
CTGGCTAGCT GGAAACGCTG CAGTTTGCCA ATACGTTCAA GACGGGAGGG AGAATAGAGA 
AACATTACCG CGTTGTCAGG TCAGTACACG TACGTCTTGT TTCTTTGGTT CGTCGTCCCT 
TCCCCTTTGA TCGACCTTTT TTTGCCTTTG CGCGTCTCAT TTTCTGCTTG TCCATTGCGG 
AAAAACTTGT ATCTTCAGAC AACCTCGCAG ACTTGCGTTC GTCCAAACAC AGTACTGACT 
GCTGCACCTA TTCTAGAAGC TTTGAGGAGG TTCTCTGAAA CCCCTCATGT CGGCGATCCC 
GGAGCAGCCG GCCGTGGAGG CTCTCAATGA CCAGCTTCAA AGCATACAGC TCGATGGCTC 
TCGGCACGCT GCGAATGGTA AACATTCAAA TCGGCCATAC GTTCAACTCC GGCCTCATCC 
CGCTCAGCTC CAACCCCCGC CCCCGCCCCA GCCCCAGTCA CAGGCCTACC AGCCGTATGC 
ACAAGCATAC ACGCCTTACC CCCAACATTA CCATCAAGCT CCTTACACTA CCTACCTTAC 
TTATTCGCCT TACCCAAACC ATCTCGCATG GCGGCCTCTC CCGGGGTCGG AACAGACGTC 
GCCTATCGAC CCTACCAACC AACATCATCA TCAGCACCAG CATTATGGTC TATGGGGCAG 
TCCGCCGGTG AGCCCGGTGA ATGCACCACC ACCCCAGTTT TTGACAGGGC AGTCACGTAC 
GGCCATGTTC GATGATTTCG GAGTTGGAGG GGCTGTCTCG GGGGCTGGTA CGGCGTATTA 
CGGCGGCAGA CCGCCGTACG GTAGTCCTCC CTCTGTATGG CAGTCACCCA CGGCGCCGTC 
ATCCTTCTTC TATACGCCTT TCCAGCAACA TGCTTCCGGT ATGGGACCGG CCATGCAAGT 
TTCGGACTGG TCGACGTTCA AGGCTCACGT CAATTTACCG GGACCATCGA AATCGGGGCC 
GATCAGTCCA ACGGATAGTA AAGAGCCAGA GAGAAAGTCG TATCACCCTC AACCGCCTTC 
AAAGAGAAGC GATTGGGTCA TGTGGGTCGG TAATGTGTAA GTCCACGTCC CCCCTACAAG 
GTTTCCCGGA CAGCACGTGG GTGCTTATGA TATGCCCATC AGCCCCAATA ACACTTCTCA 
CGAAGAGCTC TGGCATTTCT TCAACGTGAC GATCCCCATC ACCAACACCG AATCCGACGC 
CGAACCATGG CGTGGACCGT CTTCCATCTT TCTCATATCC CGCTCATCCT GCGCATTCGT 
CAACCTCTCC TCTCAAACCG ACCTCGAACG CGCCGTCTCC TTTTTTAACG GTAAGCCCCT 
CCGACCATGG GACGCCCGTT GCCCCAGGAT GGTCTGCCGC GTGAGACGGA AAGATGATGA 
TTTGAGATCC GGCGTGGGAG CCCAGCGCGG GACGGGAATG CATCGACAAT GGGTGAAGAA 
GGATAAGGAA AGGGAAAAGG AAAAGGAGGA GGGTAAGACG GGGCAGATGA GTGCAGCCAC 
AGTTTCGTCC GGACCGCCTA GCCCGGCTAT CCTGGCGCCA GCACCGGATG GGCCGGGGAG 
GAGGAGGGAC TCGATTGTAA GTGAGGAAGA GAAAAAGTTT TCGTCAGGGA GTTATGCGAG 
TACAAATTCG AGTTTCTTGA TGAGACATTT CCCGAGAAGA GTTTTCATTT TGAAGAGTCT 
CACTACGGTG AGCTTGATAC AGATTACGTC TGATTTTCAA AACTGACTTT TCCCCTCCCA 
ATTCAGGCTG AGCTCGAGGA GAGTGTGAGG ACTGGTATGT GGAGAACGCA ACAGCACAAT 
GAACCTATAT TGGGCAAGTC ATTGTATTTC TTTCCCAATT TAAGCAACAT GACCTAATCC 
GAAGCATAGA CCAAGCATTC AGGACATCCC AATCGGTCTT TCTAATCTTT GGCGCCAACC 
GAGCCGGTGA ATTCTTTGGG TACGCACGTA TGATCGAGCC TATCGACAAG GAACAAGCCA 
AACACCGCCA ATCCTCAGCT GGCACCGCTT CCCGCCGTTC AACCACCGGT GATTCCGACC 
GTTTCTTCCT GCCCCCTTAT CACAGCCGCG TAACCACCAT GTCCCCCGGC GAACTCGCTA 
CTCCTCGCGA AGACTCGTAT TTCCACGTTT CCACAGGTCA CCGAAAGACT GATCCGCCGA 
AAATGCCAAA TCATGCGGCT CCGAATAGCT CCATGGCGGA GATCCTCGCT ACGGCTGAAG 
AGCAGAGAGC GCATACGTTT GATCCCAAGA CGTTACAAAG GGATTATGAA TACCCATCTG 
TAACTCTTAC TTTGGCTGAA GCTGAAACGG GTGTTACTTC CTCTTCAGAG AAGAGCAGTC 
AGCAAGCCTC GCCTGAACTT GGACCGGCGT CGCAAGAGCC GCAAAAGATG GACGACCAAG 
GTATCTTGAG AAAAGATACA TTACCCCCTC CTTCTCCTCC AGAGCAAGAT GTGGAAAAGT 
TACAGCAAGC TGAACAGGAA ACTTCAAAGG AGTTGTCCAA CGAAGGATGG GGACATTATT 
TCCGTATCGA ATGGATAAGG CATACACCAT TACCTTTTAA TCGTACCCGT CATTTGCGTA 
ACCCTTGGAA TGCGGATAGG GAAGTTAAAG TCTCAAGAGA CGGTACAGAA GTTGAACCCT 
GTAAGTAACT GAGCTCTTTT TCATCTCGCC CATCTTTCTC ATTTTGATCG CTAATCATGC 
ACTTTGTGAT TCCAGCTGTC GGTCTTCAGC TCATGGCCGA ATGGGATAAC GAGTGATATC 
GTACCCCACC TTTCCCTACT TCACCTCAAT AGTCATGCGC CTCCATTAGT ATTACCCGAA 
CAATTCCTTG AAAACAAAAA CGCATAACAA ACGATTACTT ATATACACGG TACAAGGTCG 
TTTATTTTGA CGGACTGCAT TCAATAAACT CATGATAACA TTGACATTGC ATAAACCATT 
TATTTCGTTC TCTTTTTTTG CGGCATTATA TGGGTTTTGC ACGCCCCTTG GTTATTTGGA 
TATAATACAC GTA

Protein sequence

MSAIPEQPAV EALNDQLQSI QLDGSRHAAN GKHSNRPYVQ LRPHPAQLQP PPPPQPQSQA 
YQPYAQAYTP YPQHYHQAPY TTYLTYSPYP NHLAWRPLPG SEQTSPIDPT NQHHHQHQHY 
GLWGSPPVSP VNAPPPQFLT GQSRTAMFDD FGVGGAVSGA GTAYYGGRPP YGSPPSVWQS 
PTAPSSFFYT PFQQHASGMG PAMQVSDWST FKAHVNLPGP SKSGPISPTD SKEPERKSYH 
PQPPSKRSDW VMWVGNVPNN TSHEELWHFF NVTIPITNTE SDAEPWRGPS SIFLISRSSC 
AFVNLSSQTD LERAVSFFNG KPLRPWDARC PRMVCRVRRK DDDLRSGVGA QRGTGMHRQW 
VKKDKEREKE KEEGKTGQMS AATVSSGPPS PAILAPAPDG PGRRRDSIVS EEEKKFSSGS 
YASTNSSFLM RHFPRRVFIL KSLTTAELEE SVRTGMWRTQ QHNEPILDQA FRTSQSVFLI 
FGANRAGEFF GYARMIEPID KEQAKHRQSS AGTASRRSTT GDSDRFFLPP YHSRVTTMSP 
GELATPREDS YFHVSTGHRK TDPPKMPNHA APNSSMAEIL ATAEEQRAHT FDPKTLQRDY 
EYPSVTLTLA EAETGVTSSS EKSSQQASPE LGPASQEPQK MDDQGILRKD TLPPPSPPEQ 
DVEKLQQAEQ ETSKELSNEG WGHYFRIEWI RHTPLPFNRT RHLRNPWNAD REVKVSRDGT 
EVEPSVGLQL MAEWDNE