Gene CNC02590 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNC02590
Symbol
ID	3256355
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006685
Strand	-
Start bp	739743
End bp	741668
Gene Length	1926 bp
Protein Length	478 aa
Translation table
GC content	44%
IMG OID	638255479
Product	polygalacturonase, putative
Protein accession	XP_569552
Protein GI	58264792
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5434] Endopolygalacturonase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTTCC TCTGCCTCTT CGCCTGCGTT CTATCTAGCG CGGTCGTGCA GGGATCCCTC 
TTCGTGCTCA GTGAATCTCA AGATCAAAAA ATTATTCCTG AAATCCTTGA AAAAGATAAC 
AGCATTTGGC CCTATCACCA TGAGGTATTT GAATTCCACC CAGAGCACAA AGACCTCTCC 
ACAGGGCTTG TCCGACCCCT TTGTGTCTTA CATACTTTGG GAGAAGGAGC AGACGACTCA 
TACAACTTTG AGAAAGCTGT CCATCAGTGT GGTCGCGGCG GCATTGTGAG ATTACCAGAT 
GCCAACTAGT ATGTTCAAGT CTTGTTCAAC TTTCTAGTCA TATATCCTAA TCTAACTGGA 
TTGTAGCACA ATCAGTCGTC CCCTTGACAT ATATCTTTCC AACTCCGTTC TTGATCTTCA 
TGGTTGGCTA TCTTTTTCCG CGAACGTCTC TTCATGGATT GAAAATCGGA TGCCTCTTGG 
CTTCCAAAAT CAATCACTTG CATTTGTGGT GAGGGGTAAT GATTACATTC TCGAGGGGAA 
TGATAAAGGA GGGATAAATG GAAATGGACA AGCTTGGTAT GATTACGCAA AGGACTACGG 
AAATAAGTTC GGGCGGTGAG TCGGTTTCTC AGGCTAGCCT GTATTGTCCT TGTCATCGTT 
CTGAACAAGA CTTCATTTCA ACAGGCCCAT GTCATTGGCC ATCAAAAACA GCAAAAACGT 
CATTATAAAA AATTTCAGCA TTGTCCAGCC ACAATTTTGG GCTTCCCTCA TATGGGGTTC 
GGAAAATGTG TACATAAAAG ATTTCTACGT TAATGCTACT AGCTTCAACC CGGAATCTTC 
CAGTGATCAG AAGAACTGGC TTCAGAACAC TGGTGAGTAA ACATAGGATG ATGGGCTTAA 
GGAGTGTAGG TGCTGATAAA ATGATAAATT TACAGATGGA AGTGACACAT ACCAGAGTCA 
CAATGTCACT TACGGTGCGT TTTCGTTCAA CTGGTAATAA AAATTACTTT CCTGATCCGA 
ATGGATATAG AGAATATGAT TTACCAGGGT GGCGACGATT GTGTAGCATT GAAGCCAAAT 
AGTACATCCA TCACACTTCG TAATGTGACT TGTTACGGAG GGACGGGTAT TGCCTTTGGA 
TCGATTGCTC AGTACGCGGG CGTGGTAAGT GATGTCGGAC CTTAGGATCG CCTTCATAGC 
TGACTGTCGA GATATTGATC TCATATAGAA AGATGTGATT GAAGATGTGT TTATGGAGGA 
TATTCGACTG TATCCATCTA ATCAGTGCCC AGCCTATCAA GGTGTCTATT TCAAATCTTG 
GTTAGGGTAA GTGTCCGACT GACATCAACT AGCCTTGCCC AGAACTGACC ACATTGCAGA 
TACTCTATCG GACAGCCACC AAACGGTGGG GGTGGTGGGT ATGGATATTG TCGTAACGTG 
ACAGTAAAGG ATGTCTACAT GGAGGATATA TGGCATCCTC TCGTCGTCCA ATCTGAGTGG 
GTTTCGCTCT ACTTTACTAA CTTTCTGTAA TAAGGCGGTG ATATATCGTG CTGATGAATG 
ATACTCCACA GCTTAACCTA TCTCACTTTA GACCGTGAAA AATTTACAGA TTCCGGTCTC 
TTCGAGTAGG TTCTTTTATA AGATTGACAC GTTTCTGGAT CTGATTGATT GTAAAGGTGG 
TATGATATCC ACCTGAAAAA TTTCACAGGA AAAGCTTTGG GTAACAGGAT CGCCTGGATG 
TCCTGTTCCA AGTTGACACC ATGTCATGAT TGGACATTTG AGGGCATGGA TATCATGCCA 
GGTAAACAAG ATCACCCCGA GATCCATTAT ACTTGTAATA ATTTTGTGCT GGGGGGGAAT 
GATGGACTTA ATCAGTGCCA TCCCAGCAAC TCAAAGCTTG AAACTGAGAA TGGTGGCACA 
CTCTGA

Protein sequence

MRFLCLFACV LSSAVVQGSL FVLSESQDQK IIPEILEKDN SIWPYHHEVF EFHPEHKDLS 
TGLVRPLCVL HTLGEGADDS YNFEKAVHQC GRGGIVRLPD ANYTISRPLD IYLSNSVLDL 
HGWLSFSANV SSWIENRMPL GFQNQSLAFV VRGNDYILEG NDKGGINGNG QAWYDYAKDY 
GNKFGRPMSL AIKNSKNVII KNFSIVQPQF WASLIWGSEN VYIKDFYVNA TSFNPESSSD 
QKNWLQNTDG SDTYQSHNVT YENMIYQGGD DCVALKPNST SITLRNVTCY GGTGIAFGSI 
AQYAGVKDVI EDVFMEDIRL YPSNQCPAYQ GVYFKSWLGY SIGQPPNGGG GGYGYCRNVT 
VKDVYMEDIW HPLVVQSDLT YLTLDREKFT DSGLFEWYDI HLKNFTGKAL GNRIAWMSCS 
KLTPCHDWTF EGMDIMPGKQ DHPEIHYTCN NFVLGGNDGL NQCHPSNSKL ETENGGTL