Gene CNH03080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNH03080
Symbol
ID	3259317
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006693
Strand	+
Start bp	239966
End bp	241096
Gene Length	1131 bp
Protein Length	359 aa
Translation table
GC content	49%
IMG OID	638258177
Product	hypothetical protein
Protein accession	XP_572478
Protein GI	58270644
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.410223
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCCACT TGCTCCGGGC TTTAGCAGTC TGTGGTACCA GATTTGCCAG AGTCTGGACA 
CTTTCTGATC ATCCTGAAGG TAGGACCTTC GCAGTTGAAA CCAGTCGTCC TCTTGGCAAT 
AGCGGCCCTA TGGTTGCTGC CGACTTTTTT AGCCAAGTCA ATCTCGACCT CTTTCCGCAC 
AATCTCATCA TTCCATCACC TTCCATGGAC AGTTTTGCCG TCGACTACCG GAAATGTGAA 
CTTCTCGAGC GCACTTTATC TCGTGTTTGC GACAGTATCC TTTCGCATAC TATCGAATCA 
GCTCTCCAAC CCCGCTATGA GGGCACTTTT GACCATGGCA CAGAGGCTGA TCCTTCTGCC 
TTCACAACCC AATTACTTCG CGATGTTGAA GAGTTTGCTT GCCAAGCTCG TCCCACACTC 
AAGAAGAGGA GAACGGGGAA AGAGGAAGTA GCCCAAGGCA GAACATTTCA ACGTAGGGAT 
AGATTCGGTG ATGGTTCAAA CCAAGGCAGA GACGGTGATA ATGGAAAAGG TCCAAGGAGT 
GGTGGTGGAA AGCAGGCGAG ACGGGGTGGC TCTGGCCAAA ATAGCCAAAC TAAGGGCCGA 
GTTCAAGGTG GCTCTGGCCA AAGTGGTCCA AACGAGGACC AAGTTGGTAC AAAAGACAAT 
GGTGGGTGGG AAGATGGTGT GGGAGAGAAC GAGAGGAGTT TGGATCCATT GCTCAAGGTC 
GTCGAGAAGG AGGATCAGAA ACAATGTGAG TATATTACAT CTACTTGTGG CTTAAATGTT 
AACTTTCATT CTGTAGATTT CGCCAAGTGG CAAAGCCAAC TGCCTTCATC GCCTTCCTCT 
TACTATCCCT TGCCATCCGA TGATGACCTG AACAAAGACA AGGAGGCTAT ATTTATCGAT 
TATACCAATA CTATAGGCCG TTTCAACTTA TACTATCAGG TCTCATTTAT CACCAGGGCT 
GTAGAGATGC TCAAGATGGA GATTATCCCT ATATCAACTG CAAGGATGGA CAACCTTTAT 
TCTGGACGGA TTACCTCCCA GCATGTCCTC GCGGATCCTG GCTGGGACGC TGCCATCAGC 
GAACCGTTTT CCTCAAGGGC TCTGCAGACC CTACACTGTA TACCAGCCTA G

Protein sequence

MFHLLRALAV CGTRFARVWT LSDHPEGRTF AVETSRPLGN SGPMVAADFF SQVNLDLFPH 
NLIIPSPSMD SFAVDYRKCE LLERTLSRVC DSILSHTIES ALQPRYEGTF DHGTEADPSA 
FTTQLLRDVE EFACQARPTL KKRRTGKEEV AQGRTFQRRD RFGDGSNQGR DGDNGKGPRS 
GGGKQARRGG SGQNSQTKGR VQGGSGQSGP NEDQVGTKDN GGWEDGVGEN ERSLDPLLKV 
VEKEDQKQYF AKWQSQLPSS PSSYYPLPSD DDLNKDKEAI FIDYTNTIGR FNLYYQVSFI 
TRAVEMLKME IIPISTARMD NLYSGRITSQ HVLADPGWDA AISEPFSSRA LQTLHCIPA