Gene CNK00840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNK00840
Symbol
ID	3254415
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006680
Strand	+
Start bp	268930
End bp	270786
Gene Length	1857 bp
Protein Length	478 aa
Translation table
GC content	49%
IMG OID	638253574
Product	conserved hypothetical protein
Protein accession	XP_567647
Protein GI	58260474
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3325] Chitinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATTTCG TCAGCAATAC CGCTCTCTTT GCGATTCTCA CGGCTCTTGC TGTTCGTTCA 
GCACCTGCTC CACAATCTGG TACCGATTAC ACTTGTGATA GTGACACTCA ATGGCATGAC 
GCATACCAGA CCGTTACTTG TCCTGGCGAT ACCGTTTGTG TCACTGGTGC CAGTGGGAAC 
CCTTGCCAAT TTCCATCGGG GTAAGTTTTA TTAATGTTTC GTGACGATAA TATTGACAAA 
AGTAGTTATG GACAGTCTGG AGTAGTGGCT GTTGCGGTCA CTTCTGCCGC TGCTGTAACT 
TCGGCAGCCG CGGTAGCCAC TTCGGCTAGT GCTGCTGGAG GGGTAACCTC AGCGACTTCA 
GCTGGAGGTA TCAGCATCAG CGGAAACGCA GCCACTTCAG CTTCAGAAGA AGCTGTAACT 
TTGTCGTCGG GGGCTACAGC TACCGAATCT GGTGGTGGAG GCAGTGCCTC GCACACGAAC 
TCTGCAGCAT CGGCAAGTGG TACCTCCACT TCGGACGGCA CTAGTGTATC GAACAGATTT 
GTGACTTATT GGGATAAGTG AGTACTGCCA TTTAAGGCAG TCGAAAAGTA CTAATCAGAA 
TTCAGCTACG CAAATATGGG AGGGGTCAAC GCTGGTCAAT TGACGGCTGT TACTCATGTA 
ATTCTTTGTA AGTTCATCTC CATCAGATTA GTCAACATTC TAACCCGTTT GATCGTCATA 
GCCTTTGCCG ATATGACCGA CTGGGCTACC GAGCAAACGA CTTGGAAGTT CATGGAATCT 
TCCAACGGCA ACTTTGACTC TTCAACAGCC GCAACGCTCA AGGGCATGCA ATCGGGTCTT 
AAAGTTTGTG GAGCTCTTGG TGGTTGGGGT CTCGATAGTG TTATGGCTAC TGCAGTACGA 
GGCGGAGACT CAACTATTGC AACGTTTGTG GCCAATGTGA AGGGATTTGC CGACTACTTC 
AACTTGGACG GCATTGATAT TGACTGGGGT ATGACCAGCA CTTGATAAAT GCACAAGTCA 
CTGATACTGA AAATTAGAAT TCCCCTCCGC CTCTGATGAC GCCAACCTCA TCACTTTTAT 
TACCCAGCTG CGTGCTGCAC TTGGTGATGA CAAACTTATT TCAGTCGCAC TTGGCTCCCG 
AGTTGATACT ACCGATGCCG CCGCGTTCAA TAGTGACACG TTCTCGAAAC TTGACAGCCT 
TGTTGACATG TGGAACCTCA TGACTTACGA CTATGTCAAT CGCTACAGTA CTGTCACCGA 
ACAACAGGCT GGTAACCGCG TTGTCACCAC CGTCATGGAT TACTATGAGC AGCAAGGTAT 
CACCATGGAG AAATGTAACG TCGGTTTTCC TATGAACGCC AAGTACTTCA CCCTTACCGA 
AACCTGTGAT TCTTCAAACC CAATCGGCTG TTCTCTTCCA GGCACCGACT ACTATGAAGA 
CAGCGGCGTT GATAATTACA AGTCGGGATG GGTCAGATTT AATCCAGATT TGGATTCTTC 
GCTGGGTACA GAAGGAACAG AATGGGCGAC CAAGATGAGG GCGCAGTGGG AAGCTCGGCC 
AACCGATGGA AGTACAGAGA TTACTGCCGA TGTATCGAAC GCCTGGGTTG ATGAGACCAA 
TGATGTCTTC TGGACTTGGC TGTCTGACTC TGACATGAAG ACAACTTGCC AAAACTGGGT 
GACGTCGGGC AAGGTGGGAG GCGCTATGGT TTGGAGTCTG AACCAGGTGA CTATCCATTC 
ATTTATAGTA CGTGCTCAAA TGCTGATCCA CTTTTGACAC ACAGGACGAC GAAAGTCAAG 
ACGGAGGGAG TCACTTGACT GCACTTGCAG AATGTATCCA GGGGTCGTAA TCCATAG

Protein sequence

MHFHLLHNLV PITLVIVTLN GMTHTRPLLV LAIPFVSLVP VGTLANFHRA AVATSASAAG 
GVTSATSAGG ISISGNAATS ASEEAVTLSS GATATESGGG GSASHTNSAA SASGTSTSDG 
TSVSNRFVTY WDKLVNILTR LIVIAFADMT DWATEQTTWK FMESSNGNFD SSTAATLKGM 
QSGLKVCGAL GGWGLDSVMA TAVRGGDSTI ATFVANVKGF ADYFNLDGID IDWEFPSASD 
DANLITFITQ LRAALGDDKL ISVALGSRVD TTDAAAFNSD TFSKLDSLVD MWNLMTYDYV 
NRYSTVTEQQ AGNRVVTTVM DYYEQQGITM EKCNVGFPMN AKYFTLTETC DSSNPIGCSL 
PGTDYYEDSG VDNYKSGWVR FNPDLDSSLG TEGTEWATKM RAQWEARPTD GSTEITADVS 
NAWVDETNDV FWTWLSDSDM KTTCQNWVTS GKVGGAMVWS LNQVTIHSFI NVSRGRNP