Gene CNA01340 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNA01340
Symbol
ID	3253710
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006670
Strand	-
Start bp	357523
End bp	359374
Gene Length	1852 bp
Protein Length	383 aa
Translation table
GC content	49%
IMG OID	638252466
Product	cytoplasm protein, putative
Protein accession	XP_566593
Protein GI	58258361
COG category	[R] General function prediction only
COG ID	[COG0496] Predicted acid phosphatase
TIGRFAM ID	[TIGR00087] 5'/3'-nucleotidase SurE

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TAAGCCATTC AGCTAACAGC CCGTAGACCA GATATATGTC CGCTGTGCTC CTATCGTATT 
CTATCCCCAC TTTCCATATA TACACCATAA TATGCCTCAG CTCAAGACAT ACAGCGAGAA 
GCCAGTCGTT CTTTTGACCG TGAGTGCGCC TTACAGGGCT TGATATAGTC TTGGCTCATG 
TAGCTCATGT ATGATAAATG TACCCGGAGC AGAATGACGA TGGTCCTCCA TGCGCCTCCT 
CTCCCAATAT TTATGCATTC TGCAAACTCC TTCAGTCACG TCTCGGGTGG GACGTACGAG 
TAGTCATCCC TGACTGCCAG AAATCTTGGC AAGTTAACAA ATTGTGTTTC ATGGCGAGCT 
CTTTGTGCTA ATCAGCCAAC GCAGGGTCGG AAAGTCATAT GCTATTAGTG ACATCGTCAC 
TGCCAACTAC TTCTATCCGC TTGGTAAATG TCATATGATT AGACACTTGT TCCCGACGCT 
GATGAAGCTT TCATCTGAAA CAGAACCGGA TGGATTGAAA GGAGAAATAA CTCAGACTCG 
CCGTCCGCTG AAAGAAGGAG AGTCAATGGA ATGGGTTCTT CTATCTGGAG TATGCGTTCT 
TTTAGTTAAT GCGGTTGTGG CTGACATCTC ATGCCCGTTC TAGACTCCCG CAACATGCGC 
CAACATCGCA CTGCACAACA TTTACCCTGG CCAGATCGAC CTTGTCATCT CCGGTCCTAA 
TCGTAATGCA TCCCTTACAG AAAAAGTATA ATAACGCTGA TATCCGATCT AGATGGCCGT 
AACTCCTCAA CAGCATTCGC CCTCTCGTCC GGTACTCTTG GCGCTACCCT TGCCGCTTCC 
CTCTCTGTCC CTATTCCCGG TCCCTTGACC TCCCCGTCCT TACATGAAGA CCACATGCCC 
TGTATAGCCA TCTCTTACGG TGTCGTCACC CGTCCAGTTT CCGATAGAGT TCTTGAACTC 
GCAACCGAGA CAGCGGTGGA TGTGTGCCAG CAGTTATTCG ATAACTGGGG AGAAGATAAA 
GAAGTGGGTG GGAAGGGACT TGTGCCGATA TATAGCATCA ATATACCGCT TGTCGAGGCG 
GCTCTTGAGA AGAACGAGAG AAAGATAGTG TCAACAGAGA TGTGGAGAAA TGCGTATGGG 
CGATTATTCA AGACTACTAA ACTGTGAGTG TCTTTCCTGC TCTTCGTTGT CTTTTGGTGT 
GTATCTCGGC CTTGGGGATG GGAGCTTAAC CACCTCTTTG TGGATGGCGA CCCTTCCCTC 
AACTGGCGAT CCAACGCTTC CAAGCCAGAC CAACCAGTCA TCTCTTCATT TGTGACCTTT 
CTACAAAGCG TGGCCGAGGC TTCCGAAGAG GAAGAAGAGA AGAAGAATAA TCAAGATTAA 
GAGCAAGGAC AGAAATCTAA CATTCCCCCT CCTAGGTCAA AAGCGTTGTA CGATCCCGGA 
GATGACCCCG TCCAGATTGC TCATGGCTAT ATGAAGAGCC AAGACAAGCC CAACACCGTA 
CAGACCTCCA CCTCCCTCCC ATCTCATCCA CATACCTCTA AAACATCCAC TGCCGGCCCC 
GCCGCGCTCC CGACTCCTGC CCCACCATCC CCAATCACGC CCAAAAACAC GAAGGACGAG 
GAGCAACAGC TCAAGTTCCA CTTTGCGCCC AACATGCACC CGTTACTATT TCCACCTGAA 
GGGAGCGTGC CTGAAGGCAC AGATGCGTGG GCGTTCGCAA AAGGATGGAT CAGTGTGACG 
CCTATGAGAG CCGAGTATGC TTGTTTGGGA GCGGCAAGTA TCGAGTAACA TGAAAGATGG 
AACATTAACC ATCATAACGT ACATTATAAC TGTGTAACGT AGACATTTAT GA

Protein sequence

MPQLKTYSEK PVVLLTNDDG PPCASSPNIY AFCKLLQSRL GWDVRVVIPD CQKSWVGKSY 
AISDIVTANY FYPLEPDGLK GEITQTRRPL KEGESMEWVL LSGTPATCAN IALHNIYPGQ 
IDLVISGPNH GRNSSTAFAL SSGTLGATLA ASLSVPIPGP LTSPSLHEDH MPCIAISYGV 
VTRPVSDRVL ELATETAVDV CQQLFDNWGE DKEVGGKGLV PIYSINIPLV EAALEKNERK 
IVSTEMWRNA YGRLFKTTKL SKALYDPGDD PVQIAHGYMK SQDKPNTVQT STSLPSHPHT 
SKTSTAGPAA LPTPAPPSPI TPKNTKDEEQ QLKFHFAPNM HPLLFPPEGS VPEGTDAWAF 
AKGWISVTPM RAEYACLGAA SIE