Gene CNH03020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNH03020
Symbol
ID	3258995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006693
Strand	-
Start bp	255808
End bp	257517
Gene Length	1710 bp
Protein Length	526 aa
Translation table
GC content	54%
IMG OID	638258183
Product	hypothetical protein
Protein accession	XP_572472
Protein GI	58270632
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.18451
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGCTG CTGTCAAGAC CCATGCGCCG ACGCTTTGGA GGACTTGCAA ATGGGCCTAT 
GGCGACTCGT CCGACCTTGT GTGTGGCGAC AAAATCCTTC AATCCTCTCA AGGTGTTCGA 
CAGGGTGACC CCTTTGGCCC TCTCTTCTTC TCAATCACCC TCCGACCAAC CTTGAATGCC 
CTCAGTCAAT CGCTAGGTCC GTCTACGCAA GCGCTCGCTT ATCTCGATGA CATCTACCTC 
TTCTCAAACG ACTCGCAAGT CCTCAGCAAA ACTACCCAAT TCCTCGCCGA CAAGCAGCAC 
ATCATCAAGC TCAACGAAAA GAAATGCAAG TTAATCAGCT TCGATGAGAT CAGGCAGGAT 
GGCTTCAAGA TGCTAGGGAC GATGGTAGGA GGTAAGGAGA AGCGAGCGGA GTTTCTGGAA 
GGCAGGATTC GGAAGGAAAT GGCAAAGGTG GGCAAGCTCA AGGATCTTCC ACATCAACAC 
GCGCTCCTTC TATTACGCTT CTGCATTCAG CAAAATCTAC GACACCTGCA GAGAAGCCTG 
CGCTCGGACG ACCTTGTAGA CCTATGGGAG AGGCTGGACA CGATGCTATG GGAGGAGGTG 
AAAAGGATGA GGATGAGGCA GCGAGAGGAT ACAGCGGAAG AGGAGGCTCT CGGGAGATCG 
TTGACGAAGC TACCAGCGCG ACTGGGCGGA CTAGGTCTAC TTTCCTTCAA AGATGTAGCC 
CCCCTTGCTT ACCGCTCGGC AGCCGAGGCC TCCGACACTC TCCTCGATAA CCTAGGTCTC 
CTTTCTTCGC CTGAGGAACC TCCAACTCCG GTCCCCCAAC GAACTCGATG CGCAGAACTC 
TGGGAATCGC AACAGGAAGC CATCCTACAT AATCTCGGCG ACACTGAACG CAAGCGACTC 
ACCGAGAATG CCTCCAGACT CGGCCGAAGT TGGTTATCAG TCATCCCTTA CCTTCAGCCC 
CTGCGCCTTT CCAACGTCGA GATTGCCTCG GGTCTCCACG ACCGCACCCT GGTCGGCTCC 
TCGATACCTG TCTGTCGCTT CTGTGGGTCG GACTCACCTT TGGGTCACGA CGAGCTTTGC 
CGCGCCCGCA ACCCCTGGAC CCAGCGCCGG CACAATGCCA TCAACCGCGT CATCTATCAA 
CACCTCAAAC AAATCCAAGG TGCCACGGTT GAGATTGAGC CCCACACGCT GTCGGGACAA 
AGGAGAAACG ACCTTCGGGT CAGAGGTTCC AGCGCGCTGG CCTTCACTGA CTACGACCTG 
AAGGTTTACT CCCTCGGGGA CCGAGACGCG AGGAGCACAG CCACCCCCAG CACCCCCAAC 
AGCAAACTGG CCGAATTCTG CTTGGACCGG TGCGTGAACT GGCTCGACAA GGTGGGTCAG 
GTCGTCTCCA AGAACGCTCC GAAAGTCACC GGTGGGGTCT TTAAACCGAT CATCCTTTCC 
ACTGGTGGCC TGATGAGCAG GAGCACAGCA GACGAATGGA AGGAGTGGAG GGAGGCGATG 
CCGGTGGGGG GGTTCGAGAA AATGGAGAAA CGGATTGGTG TCGAGTTAGT AAAGGCAAGG 
GCGAGGACGC TGGTCTTATG AGGAAGAGGA GGTTGGATTA TTTTTTCTTT TCTTTAAAAA 
GTTGTTTATT TAAGTAGTTT CTTTCATTCG GGTAACACAC ACGACAACCC AATAAATTAA 
ACAACGAAAA AATGCAACCT CTATAACCCC

Protein sequence

MAAAVKTHAP TLWRTCKWAY GDSSDLVCGD KILQSSQGVR QGDPFGPLFF SITLRPTLNA 
LSQSLGPSTQ ALAYLDDIYL FSNDSQVLSK TTQFLADKQH IIKLNEKKCK LISFDEIRQD 
GFKMLGTMVG GKEKRAEFLE GRIRKEMAKV GKLKDLPHQH ALLLLRFCIQ QNLRHLQRSL 
RSDDLVDLWE RLDTMLWEEV KRMRMRQRED TAEEEALGRS LTKLPARLGG LGLLSFKDVA 
PLAYRSAAEA SDTLLDNLGL LSSPEEPPTP VPQRTRCAEL WESQQEAILH NLGDTERKRL 
TENASRLGRS WLSVIPYLQP LRLSNVEIAS GLHDRTLVGS SIPVCRFCGS DSPLGHDELC 
RARNPWTQRR HNAINRVIYQ HLKQIQGATV EIEPHTLSGQ RRNDLRVRGS SALAFTDYDL 
KVYSLGDRDA RSTATPSTPN SKLAEFCLDR CVNWLDKVGQ VVSKNAPKVT GGVFKPIILS 
TGGLMSRSTA DEWKEWREAM PVGGFEKMEK RIGVELVKAR ARTLVL