Gene CNA03300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNA03300
Symbol
ID	3253512
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006670
Strand	-
Start bp	862472
End bp	864877
Gene Length	2406 bp
Protein Length	526 aa
Translation table
GC content	48%
IMG OID	638252661
Product	hypothetical protein
Protein accession	XP_566653
Protein GI	58258481
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2730] Endoglucanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.600103
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTCAGAACAA TCTCCTTCAG CTCACTTCTT TGCACGCTCA CCCTCCTTTT ACATCACCGG 
CGCCGGCGCC ATTCCTACTC CTTTCGATTA CCCCGTACAC GACACAACGG CACACACACC 
AAGACGAAGT TATTTGCTCC TGGCGACTTT GTAAAAAGCA CGGTTTCTTC AAACTGCGCA 
CGCTTCCCTG CTACTACTTT CTCCTACCGG TCTCGCACAC GCTCTTTGAC ACTGAAAAGA 
TAGTCGCTCT TTAGGCTCCT CTTCGCAATA TTTTCATTAG CTTAGCTACG CTCCAGACCT 
TTAAACTTCT TCTCTCTCTC TACGACTTGG CTTCCCTCGT CATCCTAAAC CATCCACGTA 
CGCACATCGT GGAAGATGTG GACCAATGTT CTGTCGGTTT TCATCTTCGC AACCTTCTTT 
GCGCGCTCGA CACGCGCCCT TTCATCATGG TACACAGAGC CAGGTGGCAC ACCTACGGGT 
TCGGTAGACG GCGATAAGGT GCGAGGAGTC AATTTGGGTG GATGGTTCAT CTTGGAGAAT 
TGGATGATGC CCAGTTTTTT TGAGGAATCA ATTGTCAGAG ATACGTATCT CAATGACGAA 
GTAGGTGTCG CGCGTTTCAA GAGGCGTTGG CTGGGTGAAA ATTAATTCTT GTCTTCGCAG 
TGGTCTTTCT GTCTAGTTCT GGGACAGGAT GAGTGCCTTG CAAGACTACA GCAACATTGG 
GATACTTACA TCACTGAGGA TGACTTCAAG AGATTCGCAA ACTATTCTCT CAACACAGTG 
CGGATACCCA TGGGATACTG GGCATGGACA ACACCAGAGG ATTACGAGCC GTAAGCCAAC 
TCGAGAATTA TGGCAATGCT GATAATTTGC AGTTATATTC AAGGACAGCT CCCCTATCTT 
GAAAGAGCTC TGAACTGGTC CAGCTGGTAC GGTTTAGACG TCATGATGGA TCTCCATGGC 
CTTCCTGGGG GAGCGAACGG CCAAGACAAC CAAGGATACA AGGGACCGAT AGAGTTTCAG 
CTGAACAGCA CGAACATGGA TAGAGCCATG GAAGCACTCG CAAACATGAC ACAGTATGTG 
ACAGCAGAAA AATTCGACGG TGTCGTTAAA GCCATCGAAC TAACGAATGA GGTGGGTCGA 
TTCCTCCAAC CTTCCATATC ATCCCTAACG CTGACTCTGT TACCTCGCGT TAGCCTTACA 
TCTTAGAATA CAGCTCACGC GGAATGGACT TTTATACTTT GGCCGACTTC TACGTGAAAG 
GCTACCAGGT CGTCCGAGCA AACGAAAACA TCATTGACGG AGCCAATGAA GTAATGGTCG 
TCATTCATGA CGCTTTCCAA CCACTCTTGA ACTGGAAGTA TTTTTGGGGA GAAGAAAGTC 
TGGGCTTGAA CTGGACTAAC TATGCGCTTG ATACCCGTGA GTACTGGGGC CGTGCTGTTG 
TTGAATACCC TCTGACGGCC CATAGATATT TATGATGCCT TTGGTGGCGC CGATCAAAAG 
TCATACCAAG AGCACTTGGA CACAATATGT GCCCTATCGG CCTCTATCGC TGAAGCCCAG 
CAGTATTTCC CCGTCATTGT TGGAGAATTT GCTCTGTGAG TGAACTTGCT TTTCAGGTGA 
TTTTCGAGTC TCATATTATA CAGGGGCGTC AACACGTATT GTGTGGATTA TCAGTCTTGT 
TGGGGCCTTA CCATGGACGA GGTCATCGCC AATTTTACCT CTACATACGA GGCATCTCTC 
TTTCTGCGCC AATTCTGGGA GGTTCAGTCA GATGTGTATG AGCTTGGAGC TGGATGGATA 
TTCTGGTCAG TTCACCATGA GCTTGCTGGA CCATGGAGTT GGACACAGTC GGCTGCTCAA 
AATTGGATTC CAATGGATCC TTCTGAAAAA ATGTAAGTAA CGATCCAGTT ATCTATCTGG 
TTGAAGTGTG ATACTCTCAC TTACACGTCG GCGACCTTTA GCTGGCCCTT CGATTCTGAT 
GCCTCGTCCT ACTGTCTGGA CACCTTTAAC CCCTTAGAAG GTGACCAAAA TCTCCCTTAC 
TTCCCTTTGT ACGCCAACAA TTACACCAAT ATCGACATTT CCTCAGTTAA GCCTGTGAGA 
CTGAACGTCA ACCCCGCTTC CAACTCCACA GTAGCCTCTG CCACTTCGTC TTCTACCACT 
TCTAGTTCAC AATCCTCGAC AGCCAGTCCG TCTAGTTCTT CGTCAGAAAG CGGTAGTTTT 
TATACAGCTC CTCTACCGTC CTCTTTGGTT TTGCTGCTTA TGGTGGTTGC TGTCAGCCAC 
CTATGATTTG TAATTAGTCC CCAAGATCCC TGGCGGGTAC CAGAGACCTT TGACATGTGA 
TCCGTATGGC GCTCGCCTTG ACAGCTGGAC AGACAAGATA AAATATTCAC AGTCTTAATA 
CAAGGT

Protein sequence

MWTNVLSVFI FATFFARSTR ALSSWYTEPG GTPTGSVDGD KVRGVNLGGW FILENWMMPS 
FFEESIVRDT YLNDEWSFCL VLGQDECLAR LQQHWDTYIT EDDFKRFANY SLNTVRIPMG 
YWAWTTPEDY EPYIQGQLPY LERALNWSSW YGLDVMMDLH GLPGGANGQD NQGYKGPIEF 
QLNSTNMDRA MEALANMTQY VTAEKFDGVV KAIELTNEPY ILEYSSRGMD FYTLADFYVK 
GYQVVRANEN IIDGANEVMV VIHDAFQPLL NWKYFWGEES LGLNWTNYAL DTHIYDAFGG 
ADQKSYQEHL DTICALSASI AEAQQYFPVI VGEFALGVNT YCVDYQSCWG LTMDEVIANF 
TSTYEASLFL RQFWEVQSDV YELGAGWIFW SVHHELAGPW SWTQSAAQNW IPMDPSEKIW 
PFDSDASSYC LDTFNPLEGD QNLPYFPLYA NNYTNIDISS VKPVRLNVNP ASNSTVASAT 
SSSTTSSSQS STASPSSSSS ESGSFYTAPL PSSLVLLLMV VAVSHL