Gene CNH00790 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNH00790
Symbol
ID	3259023
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006693
Strand	+
Start bp	963711
End bp	965921
Gene Length	2211 bp
Protein Length	590 aa
Translation table
GC content	51%
IMG OID	638258403
Product	Endoglucanase E-4 precursor, putative
Protein accession	XP_572272
Protein GI	58270232
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.323744
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CCCTTACTTA CTTATTTATC GCCTTCCACT CTTTCTCCCT CTTCCGTCTC TCTCTTCCTT 
CTCGGCTGAT ATTTCAGCCA TGCTCATCCC CTTCCTTGCC CTCGCTTCTC TGTCCCGAAT 
AACCACAGCC CAGCTCACAC CGTCTCCCAC TTATTCTCCT CCAACCTCCT CTGCAGGACT 
CACAGCCTCC AGCGAAACAC CCAACACACA ATGGTCCAAT ATCCTTGGTA ACTCCCTTTG 
GTTCTACGAT GCCCAAAGGT CAGGTAGATT AGATGAAGGA ACATATGGGA ACAGAGTAGA 
CTGGAGGAAT GATAGCGCTT TAGAAGATGG GAGTGATTGG GGTTTGGACC TTGTCGGCGG 
ATGGTATGAT GCGGGTGACT ACATCAAGGC GACATTTCCT TTGGTAAATC TGTTCTATTT 
ATATTCCCCA TGACCTAGAC TAACCAGAAT AGAGTTTTAC CTTATTTGCG CTCTCCTGGG 
GGGCGTTGAC GCATGGCCAA GGATATGGCC TTGCCAACCA AACAGCCTAT CTCGATGGGA 
CCTTGCGATG GGGTTTTGAT TGGCTTATGA AGGTAAGGAA AGGCCTACAT GTGGGATTGT 
GCTATAGAAC TGATGAGAGC AGGCACACCC ATCGGATGAT GTGCTGTTTA TCCAAGTTGG 
TTCTGGGGAT GTCGACAACA ATTACTGGCA AGTCCCTTCA CTTGTACGCA GCCCAAAACA 
GATCTAACAA TCACTCAGGG GCGGGGACCA GGACATTCCA AGTCCTCGCC CGGGGTACCC 
AATCAACTCT TCTTACCCTG GTACAGATGG CTGGGCCGCT GCCTCTGCCG CCTTTTCACT 
AGGTTCCCTC CTTTACACAC CAGGCGTCTC GTACAGACCC ACTTCATCGT CCTCTCCTCC 
AACCTCACCT TCATTGGAAA ACTCCACTTA TGCGTCTCAG CTGTTGGCAC ACGCTGAGTC 
GCTTTACTCT GTCGCCAACT CTACCACCCC TCGACAAACT TACTACGCGG CTTTAGGTGA 
TGAAGTTGCC GCTTACGCCT CTTCCGACTG GCGAGATAAC CTCTGTGCAT CTGCTCTGGC 
TCTGGCACTG GCGACAAACA ACTCTGCGTA CTACGCCGAT GCATACAACT ATTATGTCCA 
ATATGGGCTG TCAGGCACAC ATGAAGTTTG GAACTGGGAT TCGTCACAGC CGGCAATTTA 
TGTCATGTTT GCGGAAATTG CGAGCGCAAA GCCCGAGTTA GCGCAAGGAG CTGGACTCGA 
CGTGAACTTG ACTGGATGGC AGACTGAAGT CGAGAACTAC TTTGATGGGC TTATCAAAGA 
GGATTTCAGT AATTCTTACT TGACCGAAGG TGAGCAAAAT CCTTCCAAAA AGACCACTAG 
CTTACGGGAG TAGGGGGATT ACTCTATTGG GATGGCGACT CTGACGAGGC GTCCTTGAAC 
CCTGCCATGG CTGCCGCTAT GCTCATGTTC AAGTACGCAC CCATGGCCTC TTCAACCGAC 
AAGACCAACT CTTACAATTC ATTCGCTCAA TCCCAACTCA ACTACCTGCT CGGCTCCAAC 
CCCATGTCAG TCCCTTACAT CGTTGGGCAA CACCCGAATT CCCCATCCAA CCCCCACTCT 
GCCCCCGCTT CTGGTGGCTT CAACATAAAT AATATCCGTG ACGACCCTCC CACCGAGGCG 
CACGTGTTAT ATGGTGCGGT GGTGGGTGGA CCGTTGAGCA GTGATCAATT TTGGGATTGG 
AGAGACGATT GGGTGCAGAC GGAGATAGCA TTGGATTATA ACGCGATGAT TCCAACTCTC 
GCCTCTATGC AGGTACGTCT TTGACTAGCT TCGCCTGGCA TTTAAACGAG GGCTTGAGAC 
TGACTCTATC TGTAGCTTAT GAACAACACT GCCGATCCAC CTTATGTCGA CATCGCTGCA 
GGCACATACT CCATCCCCTC TGGCCAACCT TGTGATGCAG CTCTTCCATG CCGCGGTGGC 
GGCGGTCTTA GCGGTGGTGA GATTGCAGGG ATTGTTGTGG GTGTTATTGT GGGTGTGGTC 
TTGTTGGTGA TTGTGGGCGT TTGGTGGTGG TGGAGGAAGA GGGGAAAGAG ATGGGGTAGT 
AAGTGGTAAG TAGGAAGCGA GGATTGCGGC GCAGTTTGGT GGACATTTGG TTTTTTGTTG 
TGTCATCATA ATGGATTTAT AAAGTCAAGC CTATGTATCC GTGTTTTTGT A

Protein sequence

MLIPFLALAS LSRITTAQLT PSPTYSPPTS SAGLTASSET PNTQWSNILG NSLWFYDAQR 
SGRLDEGTYG NRVDWRNDSA LEDGSDWGLD LVGGWYDAGD YIKATFPLSF TLFALSWGAL 
THGQGYGLAN QTAYLDGTLR WGFDWLMKAH PSDDVLFIQV GSGDVDNNYW GGDQDIPSPR 
PGYPINSSYP GTDGWAAASA AFSLGSLLYT PGVSYRPTSS SSPPTSPSLE NSTYASQLLA 
HAESLYSVAN STTPRQTYYA ALGDEVAAYA SSDWRDNLCA SALALALATN NSAYYADAYN 
YYVQYGLSGT HEVWNWDSSQ PAIYVMFAEI ASAKPELAQG AGLDVNLTGW QTEVENYFDG 
LIKEDFSNSY LTEGGLLYWD GDSDEASLNP AMAAAMLMFK YAPMASSTDK TNSYNSFAQS 
QLNYLLGSNP MSVPYIVGQH PNSPSNPHSA PASGGFNINN IRDDPPTEAH VLYGAVVGGP 
LSSDQFWDWR DDWVQTEIAL DYNAMIPTLA SMQLMNNTAD PPYVDIAAGT YSIPSGQPCD 
AALPCRGGGG LSGGEIAGIV VGVIVGVVLL VIVGVWWWWR KRGKRWGSKW