Gene CNF04940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNF04940
Symbol
ID	3258471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006691
Strand	-
Start bp	1437068
End bp	1438867
Gene Length	1800 bp
Protein Length	526 aa
Translation table
GC content	54%
IMG OID	638257612
Product	hypothetical protein
Protein accession	XP_571462
Protein GI	58268612
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

AGAGTCTTGG AGGGTTCTGC CGGCGCTGAG TTCTCCTTTT TAGCCTCGCT CGATGCTTCT 
AACGCTTTCA ACCGTGTAGA TAGAGCCGAG ATGGCAGCTG CTGTCAAGAC CCATGCGCCG 
ACGCTTTGGA GGACCTGCAA ATGGGCTTAT GGCGACTCGT CCGACCTTGT GTGTGGCGAC 
AAAATCCTTC AATCCTCTCA AGGTGTTCGA CAGGGTGACC CCTTTGGCCC TCTCTTCTTC 
TCAATCACCC TCCGACCAAC CTTGAATGCC CTCAGTCAAT CGCTAGGTCC GTCTACGCAA 
GCGCTCGCTT ATCTCGATGA CATCTACCTC TTCTCAAACG ACTCGCAAGT CCTCAGCAAA 
ACTACCCAAT TCCTCGCCGA CAAGCAGCAC ATCATCAAGC TCAACGAAAA GAAATGCAAG 
TTAATCAGCT TCGATGAGAT CAGGCAGGAC GGCTTCAAGA TGCTAGGGAC GATGGTAGGA 
GGTAAGGAGA AGCGAGCGGA GTTTCTGGAA GGCAGGATTC GGAAGGAAAT GGCAAAGGTG 
GGCAAGCTCA AGGATCTTCC GCATCAACAC GCGCTCCTTC TATTACGGTT CTGCATCCAG 
CAAAATCTAC GACACCTGCA GAGAAGCCTA CGCTCCGACG ACCTTGTAGA TCTATGGGAA 
AGACTGGACA CGATGCTGTG GGAGGAGGTG AAAAGGATGA GGATGAGGCA GCGAGAGGAT 
ACGGTGGAAG AGGAGGCTCT AGGGAGATCG TTGACGAAGC TACCAGCGCG ACTGGGCGGA 
CTAGGTCTAC TTTCCTTCAA AGATGTAGCC CCCCTTGCTT ACCGCTCGGC AGCCGAGGCC 
TCCGACACTC TCCTCGATAA CCTAGGTCTC CTTTCTTCGC CTGAGGAACC TCCAACTCCG 
GTCCCCCAAC GAACTCGATG CGCAGAACTC TGGGAATCGC AACAGGAAGC CATTCTACGT 
AATCTCGGCG ACACTGAACG CAAGCGACTC ACCGAGAATG CCTCCAGACT CGGCCGAAGT 
TGGTTATCAG TCATCCCTTA CCTTCAACCC CTGCGCCTTT CCAATGTCGA GATTGCCTCC 
GGTCTCCATG ACCGCACCCT GGTCGGCTCC TCGATACCTG TCTGTCGCTT CTGTGGGTCG 
GACTCACCTT TGGGTCACGA CGAGCTTTGC CGCGCCCGCA ACCCCTGGAC CCAGCGCCGG 
CACAATGCCA TCAACCGCGT CATCTATCAA CACCTCAAAC AAATCCAAGG TGCCACGGTT 
GAGATTGAGC CCCACACGCT GTCGGGACAA AGGAGAAACG ACCTTCGGGT CAGAGGTTCC 
AGCGCGCTGG CCTTCACTGA CTACGACCTG AAGGTATACT CCCTCGGAGA CCGAGACGCG 
AGGAGCACCG TCACACCCTG TGCCCCCAAC GGCAAGCTGG CCGACTTCTG CTTGGACCGG 
TGCGTGAACT GGCTCGACAA GGTGGGTCAG GTCGTCTCGA AGAACGCTCC GAAGGTCACT 
GGTGGGGTCT TTAAACCGAT CATCCTTTCC ACTGGTGGCT TGATGAGCAG GAGCACAGCA 
GACGAATGGA AGGAGTGGAG GGAGGCGATG CCGGTGGGGG GGTTCGAGAA AATGGAGAAA 
CGGATTGGTG TCGAGCTAGT AAAGGCAAGG GCGAGGACGC TGGTCTTATG AGGAAGAGGA 
GGTTGGATTA TTTTTTCTTT TCTTTAATAA GTTGTTTATT TAAGTAGTTT CTTTAATTCG 
GGCAACCCAC ACGACAACCC AATAAATTAA ACAACGAAAA AATGCAACCT CTATAACCCC

Protein sequence

MAAAVKTHAP TLWRTCKWAY GDSSDLVCGD KILQSSQGVR QGDPFGPLFF SITLRPTLNA 
LSQSLGPSTQ ALAYLDDIYL FSNDSQVLSK TTQFLADKQH IIKLNEKKCK LISFDEIRQD 
GFKMLGTMVG GKEKRAEFLE GRIRKEMAKV GKLKDLPHQH ALLLLRFCIQ QNLRHLQRSL 
RSDDLVDLWE RLDTMLWEEV KRMRMRQRED TVEEEALGRS LTKLPARLGG LGLLSFKDVA 
PLAYRSAAEA SDTLLDNLGL LSSPEEPPTP VPQRTRCAEL WESQQEAILR NLGDTERKRL 
TENASRLGRS WLSVIPYLQP LRLSNVEIAS GLHDRTLVGS SIPVCRFCGS DSPLGHDELC 
RARNPWTQRR HNAINRVIYQ HLKQIQGATV EIEPHTLSGQ RRNDLRVRGS SALAFTDYDL 
KVYSLGDRDA RSTVTPCAPN GKLADFCLDR CVNWLDKVGQ VVSKNAPKVT GGVFKPIILS 
TGGLMSRSTA DEWKEWREAM PVGGFEKMEK RIGVELVKAR ARTLVL