Gene CNC00010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNC00010
Symbol
ID	3256733
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006685
Strand	+
Start bp	1984
End bp	3809
Gene Length	1826 bp
Protein Length	570 aa
Translation table
GC content	52%
IMG OID	638255221
Product	hypothetical protein
Protein accession	XP_569349
Protein GI	58264386
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGGTG ACGAGCAGAC GTTCGACGAC AGAATTTTTC GTCGCTATCT TGATCGCTTC 
ATTCAAGAGA ACTGCAACTA CATGGCGATG GCTACAGAGT TCTCACATCA AGCAAATTTG 
AAAACGGTCT TCTACGACAG ATATGACAAA GAGTGGGCCA AGCTAGATCT GGTGGATATG 
TACAGACGGC GGACGGGGAA AATTCTGGGA GCCGTGAGTC ATGGCTTGTG CAAAAGGTGA 
CACAATGCTT ATTACGCATT CAACATAGCC CTCTCAATCG CAAGGCACCT CCAAATCAAA 
AAAGGATGTT GCCACTACTC CGGACGCCTC TCTCATCGGC AGCGTCAACG ATCCTAGCTC 
TCCATCGGGC CGGAAACGGA TGCTTTACGC AGTCATCGAA CTGAAGTGGA TGAACTTAGC 
GGCTCTACTT ACCGGCGAGG CTAAAAGTCA AACCGACGAG AAAGCTCTTA GTTACCTCTG 
CCAGGAAGGC GTGTTTCAAA CCATGTGGTA TGTCATCTTG GGCTACGCCA TTTCACGCTG 
CATCTTCGGC CTCTCCATAG TCAACGAATA TTTCTATAGA ATTGTGTATC TCTATCAAGA 
CTCGGCCTCA GACAGTCCCG TGCTTGCCCT GGAGGCAAGC AAAGAGTTCT TGGAGAACGC 
CGGGCGACAT TTTGGATATC CGCGGGATGG TTACTCAGTC GAAGAACTTG CAGAGCTGCA 
AGACTTTTGG TCGTCGCCTC CCAATTGTCT GATCAGCGAC CGTGCCAACG CCACTTTGAA 
TAAAGAGACA AGGTATCACC TCGATGCGAC CATCCTCTTG TTCCTCGCTC ATGCAGCGGC 
ACTTCCAACG CAACGCTTCC TCAACGACCT GCCCCTCCCT TTTGCTCATC ATGTTCCTGT 
TGATGCGACC GCTCATTCAG CCACCGACAT GAGATTGAAA GGATTAGAAG TTGGGCGCAG 
GCGACACAGT CTTCGTTCGA CCAAGAGGAA CAAGCGCACA TTGGCGGATT TGTATGATGA 
AGAGAAAGGT GAAGAGGACA AACCAGGGGA CCAAGAGGAC AAGTCAGGGG ACCGCAAGCC 
ACCTGGGAAG GATAATCGCA ACAATGATCC TAGGAACGAT GGTTCACAAG GGGGAAACTC 
TGGCTCCGGA GGCGATAACT CTCGTGGCGG AGGCTCTGGT CCTGGGGGCG ATAACTTACA 
TGACGGAGGC TCTGGTTCTG GCCGAGGACA TGAAGGCTCC GACTCTCGAG ATGTCGGCGG 
ATATGAAGGT TCTGAGTCTA GGGATGACGG CAGAGACCCT GTTCGAGATG GCGCCGGAGG 
CCCCTCTACT CATCGCGCTG AGGCTGCCGA CATTCGAACG CCTACGACAC GACAAGAGTT 
CTTGAGAGGC CTCCAGAAGC TATCCACTCC TGGAAATATG TTAGACATGA AATCATCCAT 
TATTGCCTCC CTCATCTCCA ATCCGCGTGA GCACCTTGTA ATCTTATGTT ACAGCCTGAA 
GTTACGCTTA CGAATTTATT GTAGATACCA GTACTTCTGT GGCTCCCTCC TCTCCCGGAG 
TTAACTCCAC CACGTCGTCG GAGGATGTTC TTTTCCCGGA TCTGTCATTG GACTCCAATG 
GCAGAACTCT CGTCCATTGT GATTTGTCCA CCGATCCCCT CCCAAAAGTT CACAAGTCCA 
CCCCTCTTGA TCTCGATCTC GAGGACATCG ACCCGGAAAC GGGGGAGCTT ACGTTGGCGG 
CCTATAGGGA CCGCCTCGCA ATGCTGGGGG TACGGGTGAA GTTGGTAACA AGGGAGGAGA 
TGGACGTCTT GCTGGCGCGG GGATGA

Protein sequence

MIGDEQTFDD RIFRRYLDRF IQENCNYMAM ATEFSHQANL KTVFYDRYDK EWAKLDLVDM 
YRRRTGKILG APSQSQGTSK SKKDVATTPD ASLIGSVNDP SSPSGRKRML YAVIELKWMN 
LAALLTGEAK SQTDEKALSY LCQEGVFQTM WYVILGYAIS RCIFGLSIVN EYFYRIVYLY 
QDSASDSPVL ALEASKEFLE NAGRHFGYPR DGYSVEELAE LQDFWSSPPN CLISDRANAT 
LNKETRYHLD ATILLFLAHA AALPTQRFLN DLPLPFAHHV PVDATAHSAT DMRLKGLEVG 
RRRHSLRSTK RNKRTLADLY DEEKGEEDKP GDQEDKSGDR KPPGKDNRNN DPRNDGSQGG 
NSGSGGDNSR GGGSGPGGDN LHDGGSGSGR GHEGSDSRDV GGYEGSESRD DGRDPVRDGA 
GGPSTHRAEA ADIRTPTTRQ EFLRGLQKLS TPGNMLDMKS SIIASLISNP HTSTSVAPSS 
PGVNSTTSSE DVLFPDLSLD SNGRTLVHCD LSTDPLPKVH KSTPLDLDLE DIDPETGELT 
LAAYRDRLAM LGVRVKLVTR EEMDVLLARG