Gene CNC04680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNC04680
Symbol
ID	3256500
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006685
Strand	+
Start bp	1414663
End bp	1416532
Gene Length	1870 bp
Protein Length	458 aa
Translation table
GC content	49%
IMG OID	638255687
Product	threonine aldolase, putative
Protein accession	XP_569726
Protein GI	58265140
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2008] Threonine aldolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGACTCATCT TGCCACCACA TGATCCATTT CCTGCCCTAT GGTCCGCGGC GCTTGCTTTA 
AATACGCCAG CTTGCCAGTA AGGATTTCCG CATCTATCAT CTTTCCAACA AGAACATTAG 
CGACGACCGC ACCTATCGCC ATGCCCGTAG CTTCCTCCAA GTCCTCAGCA GACGTGACCC 
CCGACGTTGG TGGACAAGCA AACGTTGATC AGTTGCACAG GGTATCTCGT GACTTTCGTA 
GTGAGTCTGA CACTGTCACA AAAGACGGCA AAGCATTGGG ACACCAACTG ATGGTCATTA 
TTTGCAGGTG ATACTATTAC CATTCCTACA GATGCTCAGC TCCTGTGCTG TCTGAGAGCC 
ACGAGAGGGG ACGATGTATA CGGTGAAGAT ACTTCGACAA CAGCGCTCGA AAAACGGATA 
GCGAAACTGA CCGGTAAGGA GGCTGCCATG TTTGCAGTCA GTGGTACTAT GACGAATCGT 
ACGTGTGCCG AAATAAAGGA AAGCGAGTTT CATACAGTAG CGTACTGACG ATGCCTTGGG 
TGATAGAACT GGCCATTAGA ACACACATGA AGCAACCGCC GCACAGCGTC ATCACTGACT 
GGCGAGCACA TGTCCACAAG ATGGAAGGTA CGTGCGATTT TCTTATACAT CGGATGCTTT 
CTGATGGAGC TTCCCAGCCG GTGGAATTGC CATGTTTTCT CAGGCGACTA CCCATCAGCT 
TGTACCGGAA AATGGTTTAC ACTTGACCAT GCAGGATATC GAGCCGGCTT TGCAGCTGGG 
TACCAATATT CACATTGCTC CTACCAAGCT TATTTGCCTT GAGAATACTT TGTCCGGCAT 
GATTTTCCCG CAAGAAGAGA TTGTAAAGAT TGGGGAAATG GCAAGAAAAC ATGACATTGG 
TATGCATCTT GATGGCGCGA GGATCTGGAA CGTGGCTGCC GATGTTATCG CGAAGAGGGG 
GCTAAATCCC AACAAAGAGG AGGATCTGCA GACTGTGTCA GTGACTTTAT TTTTTCTTCT 
CCTGAATATA CTATCCTAAC TTGTCGCATA GTCTTACAGA ACTTATCGCT CCCTTTGACT 
CGGCATCGCT CTGCCTCTCC AAGGGCCTAG GTGCACCGAT CGGTTCTGCG TTGGTCGGCT 
CTAAAGAATT CATCGATCGC GCTAAGTGGT TCCGCAAGGC TTTTGGGGGA GGTATCCGGC 
AAGCTGGTGG GATAGCTGCG TCTGCGGATT ACGCAATAAC CCATCACTTC CCAAGACTTA 
TAAAGACACA TGAACTTGCG TCGCGACTGG AGCAGGGTTT GAGAGAGCTA GGCTGTGATA 
TCCTGGCGCC AGTGGACACC AGCATGGTAT GCTACGCTTA TTGTCTGTTC ATCATTTCAT 
CCCCATGCTA ATGTTGATGG TTTGCACAGG TATTTTTCCA ATCTAAATCC ATTGGACTAC 
CCCTGGACGC TGTCATGGCC AGGCTGGCTG CTCTTCCTGA TCCCATTGTT ATTGGTGGTC 
AACGTTGCGT CGTCCACCAT CAGATTAGCC CGCAAGCGAT TGAAGATTTT ATTGGCTGTA 
TCGCCGAAAT GAAGAAGGAA AAAGAAGAAA AGGGGGAGTA CAAGGTTACT ACGCTAGGGC 
AGGAGGAGAA AGACAAGTTG TCTAGATTTG TAAGTCCGGA GATCAAAAAC GAGACAAGCG 
AAGCTAGATT GAGGAAGGAG GCTGCTCTGG GGTATTAATA TTCATGTGCC TTGTTGTTTG 
TGCAGCTTGT ACTTTAAGAA CTGTCTGTAT AAATGTAACG GGGGCGTATA GGTGGATAGA 
CGGCCAAAGA TGCAGTTTTA CGTATCATGT ATAGTGGTTT CGCATGCAGC GTGCAGCTCA 
GCCCACGCAT

Protein sequence

MVRGACFKYA SLPVRISASI IFPTRTLATT APIAMPVASS KSSADVTPDV GGQANVDQLH 
RVSRDFRSDT ITIPTDAQLL CCLRATRGDD VYGEDTSTTA LEKRIAKLTG KEAAMFAVSG 
TMTNQLAIRT HMKQPPHSVI TDWRAHVHKM EAGGIAMFSQ ATTHQLVPEN GLHLTMQDIE 
PALQLGTNIH IAPTKLICLE NTLSGMIFPQ EEIVKIGEMA RKHDIGMHLD GARIWNVAAD 
VIAKRGLNPN KEEDLQTVLT ELIAPFDSAS LCLSKGLGAP IGSALVGSKE FIDRAKWFRK 
AFGGGIRQAG GIAASADYAI THHFPRLIKT HELASRLEQG LRELGCDILA PVDTSMVFFQ 
SKSIGLPLDA VMARLAALPD PIVIGGQRCV VHHQISPQAI EDFIGCIAEM KKEKEEKGEY 
KVTTLGQEEK DKLSRFVSPE IKNETSEARL RKEAALGY