Gene CNF00520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNF00520
Symbol
ID	3258096
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006691
Strand	+
Start bp	178425
End bp	180630
Gene Length	2206 bp
Protein Length	394 aa
Translation table
GC content	49%
IMG OID	638257175
Product	hypothetical protein
Protein accession	XP_571233
Protein GI	58268154
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACAGGA AGGGCAGCTC GTCAACGCCG TGCAAAAAAT CAGGACAAAC GCTCAGCCCG 
GCTTCTAACG TATATGCCAG CAACTCGTCA AAGAAGAAGA GCGAAAAGAG GGAAGGAAGA 
GACGAAAGTG GGGATGTAGC CAATTATGAC AGCTCAGACA TGACAGATGG CAGTGAATTT 
GAGAGTCCAG TGGAAGATGA AGAAGACAAT GATCAGATAT TCTATATCGG TTAGTGCACA 
GGGCAGGCAG TATATTGATC AGCTCCTGAC TATCAGATCC ATGTAGATGC AATTATGTAT 
GCTCATTTTC GAGATACCAG GTCACGTAAA GATGGACTGG GATGGTACGG ATGGGTGAGT 
ATCAAAGTGG TTTCGGAAGT CGAAACTGAC AATGAGACTT ATGTAGCATT ATGGGGTGAT 
GGCAAGTGGG CGAGCTACAT GATTCAGATA TGGGACTAAC TTCCGACAGT GGAAAGGTTA 
CCTAAAATCC TTGTCGGATA CGTGAGCAAC TGTCCTCTAT CAAGCTGATT TAGTGCTAAA 
TCATTATGCA GAGAGGAACC TCTGAGTTCA TTCGAAACCG AACTCAATGT CGCTCCTCTG 
GTGACATCGT GTGTAGCTCG TGGGATTCAT GTATTTTAAG CTGACTAGAC TCCCCGTACA 
GGTTTTGGCA GGCAGTTGAT AAACCGATAC CAAAAGGGAA ACTGGAGCCA CCAGGCAGGA 
AGGGCGACTA TTACGAGATC GCGCCCGATC AGATGGGTAA GATTCTTTCG TTGTTATCTT 
CATTTATTTA TCACTGAGAT GTATGCTGTT ATTTCACAGA GGATATTCTT TTAACTTGCT 
ACCCTAAACG GACATGGAAA ATCTACAGCC GTCGGCGTGC CAAGCAACGA GCGCACCAAC 
TAGCCCCTCC AAAAATCCGA GCTAAACCGT TACGAATTCA GAAGCGTGAC TCCGACCACT 
ACAACTATGA ACGGTATAAA AGGAGGAGGA AGGTTATGCA AGAAGCTGAG GAGAAGCAGA 
AGAAAGCACA TGGCATCAAG AAAAAAGAAG AAAAAGGATC ACCGGAATGG GCTTCAACCT 
CTATCAGTGA TTCAGACTCT ACAGAAATGA GCTTGGATGA TGAAAATAAC GTTCCCTCAA 
TGTCCGACAA GCGAGCCCAA GGGAAAAGGA AGGAAGGCCC TAGGAGGACG AAGAAGCACG 
TACAAAGTTC CTCGGAGGAC GAGAATCAGA CTGAGCTGAA AGAGACGACC ATCGAGAGGA 
AGAGGCGGAG AATTCCTTCA TCCGCGTTAT CGTCTGTGTC ATCACCTTCC GACAGCCCCA 
GATCAAGCAA GCAGAAGGAG CAGTCATTAC AACCATCTAT CGAGGTTGAG ATACCCATTG 
CGGTTGATCG AATGAGGTCA AGGCAGCCGT CACAAGGAAC AGGTCCAACC CAACTCTCTT 
TTGGACAGCT TCAACCTGGG ATTTTTGATC CTGATCCTCC TGTTACGGCT ACTTTCCGGG 
GAGGGCTTAG CGATGCACCG CGTACTGTTG CGGCCACTGT TGTCTCTTCG ATATCTGCCA 
TCGAACCGTT CCCTGAGACT CAACAGTCAG GTTCCCAGCC TTTACCTTCC TTCCCTCCGT 
CCCAGGCTCC TCGCGTATCA ACCCAAACTC AAACACGAAG CTCCCGTCAA CATTCGCCTC 
AACCTCAGCC ACAACTTCAA CCGCAACCAC AACCTCAATC GCAACCTCAG CCTCAGCATC 
AAGCCCAATC TCTGCCCCGA ACACAGCCGC AGCCTCAGAC ACCGAACTCA CTGTCAGCCT 
CCTCTGTCTC AGGGCTTCCG GCTGCCACCA ACAAATCACA GCCAAAATCC ACATCTCTTT 
CTGCAAATCA AATCCAAGAA ACAATTGCCG ACGCTAACAA TGCTTCAAAG ACACCAGTGG 
CTGCCTTTCC GCAACATAAT AGCAGGCAAG GTAGTAAAGA TAATGCTGGC AACACAGCCG 
GTGCCTCTCA AAATAGTGTC GCTCCGATTG ATCAACAGCA GAAGCAGACG ACTACAGGAT 
CAGTTGAATC TACACTGAGA GGGACCGTCA ACCGTTTTTC CGAAGGCAGT ACCGGTGAGG 
CTTCGAGACC GTCTACCACG CCTTCAACCA GTCGCACTCT GATTCCCAAT CAGTCTGGCA 
ACCTGTCCCA TCAGATATCC GTCTCTTCAT TGCAAGAACC TATTGA

Protein sequence

MDRKGSSSTP CKKSGQTLSP ASNVYASNSS KKKSEKREGR DESGDVANYD SSDMTDGSEF 
ESPVEDEEDN DQIFYIDAIM YAHFRDTRSR KDGLGWYGWR GTSEFIRNRT QCRSSGDIKR 
DSDHYNYERY KRRRKVMQEA EEKQKKAHGI KKKEEKGSPE WASTSISDSD STEMSLDDEN 
NVPSMSDKRA QGKRKEGPRR TKKHVQSSSE DENQTELKET TIERKRRRIP SSALSSVSSP 
SDSPRSSKQK EQSLQPSIEV EIPIAVDRMS QVPSLYLPSL RPRLLAYQPK LKHEAPVNIR 
LNLSHNFNRN HNLNRNLSLS IKPNLCPEHS RSLRHRTHSG ASQNSVAPID QQQKQTTTGS 
VESTLRGTVN RFSEGSTVWQ PVPSDIRLFI ARTY