Gene CNL04780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNL04780
Symbol
ID	3254901
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006681
Strand	-
Start bp	340424
End bp	341861
Gene Length	1438 bp
Protein Length	236 aa
Translation table
GC content	50%
IMG OID	638253949
Product	carbonic anhydrase protein, putative
Protein accession	XP_568020
Protein GI	58261220
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0288] Carbonic anhydrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.360959
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TGCATATATC CACAATACCC CGCTCCGCGA GCCTTCGTTG CCCGCTATCC ACCGCGAAAA 
TACCCACATC ACACGTTAGA GCCATCTCTC CCATTACACA GTCGCTATAT AGAACTCGAC 
TGGCCTCCCA CAGAGCCCAC TTTTCATTCA GCACACTTCC CAGACCCACA TTCGGTCTCC 
TTCAGCTTCC CACCATTTGT TCCTCCAGAT CTATAAACAC CACCAGCATC GCCAACATGC 
CTTTCCACGC CGAACCCCTC AAGCCCTCCG AGGAGATTGA CATGGATCTT GGGCACTCTG 
TGGCTGCCCA GAAGTTCAAG GAGATTAGGG AAGTCCTCGA AGGCAACAGG TACTGGGCCA 
GAAAAGTCAC TTCTGAGGAG CCCGAGTTCA TGGCCGAGCA GGTCATGGGT CAGGTGAGCA 
GCTCCTGTCT CTGGAACGTT CGAAGCACAT CGTAAAAGCT AATTCATGAT AATGCAGGCG 
CCCAACTTTC TTTGGATCGG ATGCGCCGAC TCTCGAGTTC CAGAGGTTAC AATCATGGCT 
CGTAAACCCG GAGACGTGTT TGTCCAGGTA TGTTTCTACC CTCCCGACTT TCGGTCATCG 
TTGCCTGTGC ACAAGATGCG CTGCGAAATG AAGGGGCTAA CAAAAGCTTG GTTGCCTGTA 
GAGGAACGTT GCCAACCAGT TCAAGCCCGA GGACGACTCT TCCCAGGCTC TTCTCAACTA 
CGCCATCATG AACGTTGGTG TCACTCACGG TAAGAATCTT CCGCCCCTAT GGTATTGCCA 
AGTCTCTATA GACTGACTTG GGACGCCATT AGTCATGGTT GTTGGTCACA CCGGTTGCGG 
TGGCTGTATT GCTGCGTTTG ACCAGCCTAT CCCGACTGTG GAAAACCCCG GCGCGACTCC 
TTTGGTGCGA TATCTCGAAC CCATCATCAG GCTGAAGCAT TCTTTACCCG AGGGAAGCGA 
TGTGAACGAC TTGATCAAGG AGAACGTCAA GATGGCCGTA AAGAACGTTG TTAACAGCCC 
TGTAAGCTTG CCCCTCATTG ATTAGGGCTA TGGATCACTC ATAGCAAATG TAGACTATTC 
AGGAAGCTTG GGAAAAGGCC AGGAAGGGCG AGTTCCGGGA AGTTTTTGTC CACGGCTGGG 
TGAGTTGCAT TCTGTGACTA TGGCATGGCC CATTGACTGA TGCCCATATA GCTCTATGAC 
CTTTCTACCG GCAACATTGT TGACCTCAAC GTCACCCAGG GTCCTCATCC TTTCGTTGAC 
GACCGAGTGC CTCGAACGTA GATAGGAGTA GTTGTAGAAG TAGAGGATCA TACTGATTAT 
TATGGGTGTA TCAATAGATA GGAATTACAG GCTACAGCAT AGATGAGATG GAGGTTTCTT 
TCGTTATCAT TTATCAGTAT GTGAATAGAA TAGAATGCAT ACAACGCATA TATTGCTT

Protein sequence

MPFHAEPLKP SEEIDMDLGH SVAAQKFKEI REVLEGNRYW ARKVTSEEPE FMAEQVMGQA 
PNFLWIGCAD SRVPEVTIMA RKPGDVFVQR NVANQFKPED DSSQALLNYA IMNVGVTHVM 
VVGHTGCGGC IAAFDQPIPT VENPGATPLV RYLEPIIRLK HSLPEGSDVN DLIKENVKMA 
VKNVVNSPEA WEKARKGEFR EVFVHGWLYD LSTGNIVDLN VTQGPHPFVD DRVPRT