Gene CNN01800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNN01800
Symbol
ID	3255311
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006683
Strand	+
Start bp	517538
End bp	519401
Gene Length	1864 bp
Protein Length	551 aa
Translation table
GC content	56%
IMG OID	638254598
Product	conserved hypothetical protein
Protein accession	XP_568684
Protein GI	58262548
COG category
COG ID
TIGRFAM ID	[TIGR00756] pentatricopeptide repeat domain (PPR motif)

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCAGGC TCTGCCGCAC ATGCCGCCTC GGCGCATACA CCCCGCGCAG GACACTTGCC 
ACCGCCACCG CCACCGCGCC CCTTCCCGAC CTGCCCCCGC GGCGGCCGCA GTTCCAGCCA 
CAACGCCCAG ACAGAGCAGG CCGGGAACGA GACCGCTTCC GGACTCCCGA CAGCAACAGA 
CTCCGCCTCG CAAACATCCT CCAGACACTC ACGAAATACA AGGCAGAGAA CCGCTCGCCG 
ACGCCGGTAG CGTATGTCAA CATTATCGAA GCAGCGAGCG AATTCGCGTT GAGCCACAGG 
GTCGACGGGG ATCAAGGCGA CGGGCTGGGG TTCCAGGTTG CGTTGGCGGC GTGGGAGGAT 
GCGAAGCGGG GAGGTGTTGA GCTGGGGCAG GAAGGTGTTG ATGCGATGAT GAATGTGAGT 
GGATACCGGT TTTTTTGATT TGTGAAATGG TGTGGGCTAA TAGTTGTTCA GTTTGCGGTG 
ATCTATCCCC AGCTGCTCTC TTCCCTCCTT CTTTACACCA AAACCCGCCG TCTCGCGACG 
TACAATGCCA TGTCCAGAGT GGCCTCTTCC AGCTTTGATG TCGAGCAGAT GGTTTACCTT 
TTGGAGGAGA TGTCCCAGCA AGGGTTCGTT CCCAACACTG CCACTTTGAA ACATACAGTC 
CGCCAGGCAT GTGAATGGGG ATACCCCCGA TTGGCTCTTC AGATTGCGCA AAAGGCCGAG 
GAAGAGTCTA GTTTTGGGTT CAGGCTTGAT CAGAGTGCGT GGGTTCAGAT CCTCATTGCG 
AGTGCGGACA ATCACTATGT ATGTTCCTAC CCGTTTATTT GCTACGTCTC TTGTCGCTAA 
ATATTTCAAA ATTGCAGTTG AACGGTGTCG AGACCGCATG GGAGCGTGTC AAGTCCAGCT 
ACACCCCGGA CGAGGGCCTC ATTCTCTCCA TGCTCAACGC CGCCGGCAGA TGGGGTCGAC 
CCGATTTTTC ATCCACCATC CTTGAACTCC TCCCCGGTCC GCCCCAAGAA CATCACCTCG 
CCCCTCTCCT CGAAGCATTC TGCAACGCCG GCCAAGTGCC CAACGCTTTC CACGTCATCA 
GCACCATCCG CTCCACCGGC CTCACCCCGA CCTTGTCCTC CATCCAGCCG ATCGTGAACG 
CGTTGAAATC CGCAGAGGTC ATTGACCAGG CGTACTATAC TCTGGAGGAT ATGCACAAAT 
CCGGCCAGGC GGTGGATATC ACAGCGTTGA ACGCTGTGAT TGCGGCTAGC AGTTCTATCG 
GTGATCTCCA GCGTGCTCGG GCTACCCAGA GCGCGATCCC AGAATTCGGC ATGACGCCCA 
ACATTGATAC ATACAACCTC GTCCTCCAAT GTTGCGTGAC CACCTCTCAC CGCCCATTAG 
GCGATACCCT CCTCTCCGAA ATGGCTGCCC AGAATGTCCA GCCCAACGCT ACCACTTACG 
ACCACCTCAT CCACCTCTGT CTCACCCAGC CTTCTTACGA AGACGCATTC TACTATCTCG 
AAAAAATGAA AGCTGGCGGC TTCAAACCCG GCTACGCCGT CTACGCTTCC CTCGTGAAAA 
AGTGTGTCAA GATGGGCGAT TCGAGGTGGA GGTTGGTAGT CGATGAGATG AAGGATGTGG 
GGTACAAGAT TGAGGCCGAG TTGCAAGGGT TTATTAATAA TGGAGGAAGG GAGAGGGGAA 
GACAGGCGGC GGGGCAGAGG AGGGCGAATG ATCAGATGGT GGGGAGTAAG AGACGGAGCT 
GGATAAGGCA GGCGGCTGAG GAGGCTGTGT AGCGGTGTGG AGGGCTTTTT TCTGGTGGAG 
ATTTATTTAG GAGCATGGTT TTTCTCCTTG CACCAACAGG GCTCATGCAT TGCATCATGA 
TTCA

Protein sequence

MLRLCRTCRL GAYTPRRTLA TATATAPLPD LPPRRPQFQP QRPDRAGRER DRFRTPDSNR 
LRLANILQTL TKYKAENRSP TPVAYVNIIE AASEFALSHR VDGDQGDGLG FQVALAAWED 
AKRGGVELGQ EGVDAMMNFA VIYPQLLSSL LLYTKTRRLA TYNAMSRVAS SSFDVEQMVY 
LLEEMSQQGF VPNTATLKHT VRQACEWGYP RLALQIAQKA EEESSFGFRL DQSAWVQILI 
ASADNHYLNG VETAWERVKS SYTPDEGLIL SMLNAAGRWG RPDFSSTILE LLPGPPQEHH 
LAPLLEAFCN AGQVPNAFHV ISTIRSTGLT PTLSSIQPIV NALKSAEVID QAYYTLEDMH 
KSGQAVDITA LNAVIAASSS IGDLQRARAT QSAIPEFGMT PNIDTYNLVL QCCVTTSHRP 
LGDTLLSEMA AQNVQPNATT YDHLIHLCLT QPSYEDAFYY LEKMKAGGFK PGYAVYASLV 
KKCVKMGDSR WRLVVDEMKD VGYKIEAELQ GFINNGGRER GRQAAGQRRA NDQMVGSKRR 
SWIRQAAEEA V