Gene CNA03910 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNA03910
Symbol
ID	3253406
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006670
Strand	+
Start bp	1050504
End bp	1052323
Gene Length	1820 bp
Protein Length	575 aa
Translation table
GC content	49%
IMG OID	638252710
Product	mitochondrion protein, putative
Protein accession	XP_566735
Protein GI	58258645
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2175] Probable taurine catabolism dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CAGCACCCAA CACCTGAACT TGCTATCACG TCCGCCTCAT GTCCCTTCGA CTATTCCTGT 
CTCGCGTTCC ACCAAGCCAG CAATTGCCGA GTAAACTTCT GCCCCAACTA TCGCTGCGTC 
GAGCGCAGAG CTCTAGTTCA GATTCACGAC CTCCGCATCC CGCCGTGCAG CAGAGCTTCG 
AGGCACTCGC CTCTGACCTT CTTGCCACCC CGAGCACGCT CTCGTCCTCT GGCTTGAAGA 
GATCTGCACC GGAGGCTCCG CGAACATTCA TCAAGTCGCC CAGTTTGCCT CCAGTCCAAC 
TGAGTCGTAA CCCCTATGCG GGGCAGTATG CGATTTCTGA AGATGATTTG GATGACCCTT 
TTGAGACTGA GATTGCTGTT GAAGAACCCA AAGGCCTTGC TGTACCTCCC AGGCGCAGAC 
GCTTGGCTGG GCGGCAGAGC TCGGCAACAG CACGACCACA GAGAATTATC AATCTTTCAC 
CTCATGATAC TGTCTCGGTG TATCCCGATT TTATCTCTTT AACATCCCAT GGTAGGACGG 
GAGTCATAAC CAACGCACGA TTACTTGATG CTTGCCACTG CAAGAAATGC AGGGACCCAT 
CTACCCGACA AATGAATACT ACTACAGGGG AAGCCGTTCG TGAATCCAAA ATAGCAAGGA 
TCACCAGAGG CAATTCAGTT CGTAAAGGTG GCATTCGTAA AGACGGGCTT GTAGTGAGCT 
GGGGTGAAGG AGTGAAGCAT ATGAGCTTTT TTCCTCTCCA CAGATTACGG TCGATGCTAG 
AAAGAGACAT GGGCACTGTT TATCGTAGCC CAAGTTTTGT TCACCAGACT TGGGACGGGG 
AATCACTTTC TCTTACCAAT CTAAGATTTC AATACTCGGA TCTATCTGAA TCTCTGTTGA 
AAGTTTTAGA GCAGCTTCAG GTGTACGGTA TAGTCGTGAT AGAAGGCGTA CCTACGGACC 
CTACGGATGA TAAGGAGTGC ATGCTGAGAA AAGTTACCGA TATGATCGGG AAGATTAGAA 
ACACATTCTA CGGGGAAACG TGGGATGTGA AAAGTGTGAA ACAGAGCAAG AATATTGCGT 
AAGTGGAACT GCTTATTGGG TCTCTCACTT CCTATACTAA TACGACATTC AGCTATACCA 
ATCTCAACCT TGGCTTACAT ATGGATCTTC TTTACTTTTC ATCCCCTCCT CGCTTCCAAG 
CACTTCACTG CCTCCGGAAT AAGGTTGAAG GCGGTAGCTC TTACTTTGTG GACTCTTTTC 
GCACCGTCTC CGACCTACCC CGAGATCAAT TCGAATTCCT GCAAAAAATC AATATAACCT 
ATCAGTACGA CAATGACAAC CATTATTTTC GCTATCGTCA TCCCATCATC AGTTCCGATT 
TTGTGCGTGG TCGAAACAAT CGACATGCCG CCGTTAACTG GAGTCCCCCT TTCCGCGCCG 
CTGCCGAAGC TTTAGACTTT CCCCAGCACG ATTTCGTTGC GGCCGCCAAA CATGAGCAGA 
AAGTGCTTCA AGCCATTGCG GATTTTGAAG AACGCCTGAG CGACCCTCGC TATCGATACG 
AATTTACCAT GCAGGAAGGG GACCTAGTGC TATTTGACAA TCGAAGAGTC CTGCACGCAC 
GCACGGCGTT CCGCGACAAG AAAGATATGG AAGTAGAAGA AGAAGAAAGA GTCGAGCAGA 
AATCGGAGAT GGAAAGTGAT AAGGAACCAA CTAGGTGGCT GAAGGGATGT TACTTGGATG 
GGGAAGCTGT ATGGGACAAG TTGGCTACAT TAAGGAAACA GTCTTTGGAA AGGAGAGCGG 
CTTCTGTGGG GGTTCAATAA

Protein sequence

MSLRLFLSRV PPSQQLPSKL LPQLSLRRAQ SSSSDSRPPH PAVQQSFEAL ASDLLATPST 
LSSSGLKRSA PEAPRTFIKS PSLPPVQLSR NPYAGQYAIS EDDLDDPFET EIAVEEPKGL 
AVPPRRRRLA GRQSSATARP QRIINLSPHD TVSVYPDFIS LTSHGRTGVI TNARLLDACH 
CKKCRDPSTR QMNTTTGEAV RESKIARITR GNSVRKGGIR KDGLVVSWGE GVKHMSFFPL 
HRLRSMLERD MGTVYRSPSF VHQTWDGESL SLTNLRFQYS DLSESLLKVL EQLQVYGIVV 
IEGVPTDPTD DKECMLRKVT DMIGKIRNTF YGETWDVKSV KQSKNIAYTN LNLGLHMDLL 
YFSSPPRFQA LHCLRNKVEG GSSYFVDSFR TVSDLPRDQF EFLQKINITY QYDNDNHYFR 
YRHPIISSDF VRGRNNRHAA VNWSPPFRAA AEALDFPQHD FVAAAKHEQK VLQAIADFEE 
RLSDPRYRYE FTMQEGDLVL FDNRRVLHAR TAFRDKKDME VEEEERVEQK SEMESDKEPT 
RWLKGCYLDG EAVWDKLATL RKQSLERRAA SVGVQ