Gene CNM01800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNM01800
Symbol
ID	3255166
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006682
Strand	+
Start bp	547367
End bp	549666
Gene Length	2300 bp
Protein Length	480 aa
Translation table
GC content	52%
IMG OID	638254334
Product	cytoplasm protein, putative
Protein accession	XP_568308
Protein GI	58261796
COG category	[S] Function unknown
COG ID	[COG1723] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.389549
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTCCCCCCCA CGATGCCGTC CACGGCCCAG AACACGCTGC CCCTGCCGTA TGCGCAGGTG 
GCGGCACAGC CAAGGCGAGA GCAGAGACAG CCCACACGGT GAGCAGCGAG TCCAGCAGCC 
AGAGAAACCC GCTCACGCCC CGCAGAACAT CCAAGCTCGG CAGCAGTACG TCCCAGCACA 
CACCCCTATG CATCGCCCAC TGACATGTCT GCCAGAGCTC AAGGTCCTCC CGACCCAGCC 
AGAGACCCCC ACCATCCCAG AGGAGGAAGA GGACGACGAT GGGACAGGCC GCGCACTTGC 
CGATCACGAC GAGTCTGAAG GCGTCGAGGT GCGTCTGCTT GGCTTTGCAG AACGGCCATG 
CATGCTGTCG ACGATCGCAG GCGCTGACAG CAGAGACGCA GTTCTACACG CCCATCTCCC 
AGATCCCAAA GGGCACAGCC CGTCGAGACG CCCAGCGTCT CACCAAGTCC GAAAAAGCCA 
AGCTCCCGCG GGTGACAGCG TACTGTACCG CAGCGTGCGT CCATACTCCT GCCCGCTGCC 
CAGATTCAAC GTCCTAACGA CTCGACTGAC TTGTAGCACG TACAACCTGC AGGCGATGCA 
AGCCTACCTC GCCTCCCGCC CGGCATACCA CCGCACCCAC CCGCGCATGT TCGACACCGA 
ATGTCTACAC ACGCCATACC TGCCCCCTCC CACCCTGGGC CCGCACGGCA TGTCAGCCCA 
TAGAAATTCT CCGAGGCTGA AACCTGTCTC TGGAGCTGGT CATGTACCAG AAGGGGATTT 
GCTCAATTTA GGGAATGACT ATTCATCAAC GGCTCATAAA CGTGCCAGCT CGCCAAGCCG 
ATCTAACCAG AACCAAAACC AAAACGAGGT AAAGCGCCAA CCGGGGTTCT CTAAACGACC 
CGGTAGCGGG CGCAAGAAAT CCTCTTCTGG GTCAACGTCC AAAGACACCG GCGCGGATGG 
GATGACGGAT AGTGAGAGGG AAGAGGATGA TGACTTTGAA GACGAATGGA TCCCGGACGT 
GTTCCTGTTC GAGTATGGGT GCGTCGTGCT TTGGGGAATG ACGGAAAGGG AGGAGAAAAA 
GTTCTTGGCT AGCATGTGTG TCTTTTAATG TGCTATTCAT AGGACGTACG AGCTGACGAG 
GATAACAGAA AGAGGTTTGA AATTGAGAGA TTATCAGCCG AAGACGTCGA GATGGAGGAC 
CTCAATTTTT ACTATGCCGA TTACTCTCGG TACGTCGCTT TCCACTCCAT ACACCTCTCC 
CAAATCACAA ACGCTGAGAC TTTTGCCAAC TTGTTTCAAG TATATACAAC GACGTAATCA 
CGTTGCGTAA AGGATCTTCC TACATGTACG TCCTCTCCCC TAATGCCTTT TTTTTTTACC 
TCTCGCATAC CTGCTTCGAC TAACACGATT CTACATGATG ACAGGACAAA ACTCTCCCTT 
TCACATGCGC TCTCCCAATC CGTCAAGATA TCACTATTCG AAGAACTCAT CATGGGTACG 
ATCGAGCAAA CGAAAGATAT CCCCAAGAGC CTTTCCGAAA CTGGAAAAAT TGGCGTGCGT 
CCCTTCCCCA TCTTGGGTTA TCATCAAGTT TGCAAGTTTA CTAATCGTCT TCTTCCTTTC 
CTTTTCTTCT CTGTATGATG ATTGTAGTTG CCAAGAAGTG AGATTATGAA GCAGATCGGA 
AACCTTTTCA TTCTGCGTAT CAATATCAAC CTCGTCGGGT CTATCCTCGA TTCTCCCGTA 
AGCCGTTTTC TTCCCCCCTC CCTCTTTTGC ACCCCACTAA TCCCTGCCTT TTTTTTCCCT 
CTCCCTCTAC CTCCCCCCCC GATCTGAAAC GACAGGAATT CTTCTGGACA TTCCCCGACC 
TCGAACCACT CTACAACGCC GCCCGGTCAT ACCTCGAAAT CGGCCAACGT GTCGAACTCT 
TAAACGCCCG TGTAGATGTT TTGCAGGATA TGCTCAAGTT GTTGAAGGAG AGTGTGAATT 
CGAGTCATGG AGAGAGGTTG GAGGCTATTG TCATTTTCTT AATGTCCGTC CTTACCCAAC 
ACGACTTGTT ACTGATGCTG ACGAATGGAA ATGTCCAGTG GAATTGAGAT TGTCCTCGGT 
ATCATCACCA TTCTTGTCGA TCTCAGTTTC TCGTAGAAAT CCCGACGACT CAAAAAATCG 
ACATCGAGTC GAAACTGAGT CGAGATCAAG ATTGCGTCAA GAAGCCCAGA TCTGTAACAA 
ATGAAAAGGT TTGAGCAAGG ACGGACAGCT AGGGAAGGGG CAGTGTAAAT GCAGTTAAAT 
AGATGCTGAT ACAGCGAAGC

Protein sequence

MPSTAQNTLP LPYAQVAAQP RREQRQPTRT SKLGSKLKVL PTQPETPTIP EEEEDDDGTG 
RALADHDESE GVEFYTPISQ IPKGTARRDA QRLTKSEKAK LPRVTAYCTA ATYNLQAMQA 
YLASRPAYHR THPRMFDTEC LHTPYLPPPT LGPHGMSAHR NSPRLKPVSG AGHVPEGDLL 
NLGNDYSSTA HKRASSPSRS NQNQNQNEVK RQPGFSKRPG SGRKKSSSGS TSKDTGADGM 
TDSEREEDDD FEDEWIPDVF LFEYGCVVLW GMTEREEKKF LASIKRFEIE RLSAEDVEME 
DLNFYYADYS RIYNDVITLR KGSSYMTKLS LSHALSQSVK ISLFEELIMG TIEQTKDIPK 
SLSETGKIGL PRSEIMKQIG NLFILRININ LVGSILDSPE FFWTFPDLEP LYNAARSYLE 
IGQRVELLNA RVDVLQDMLK LLKESVNSSH GERLEAIVIF LIGIEIVLGI ITILVDLSFS