Gene CNC04430 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNC04430
Symbol
ID	3256636
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006685
Strand	-
Start bp	1341937
End bp	1343634
Gene Length	1698 bp
Protein Length	565 aa
Translation table
GC content	51%
IMG OID	638255664
Product	amino-acid N-acetyltransferase, putative
Protein accession	XP_570013
Protein GI	58265714
COG category	[E] Amino acid transport and metabolism
COG ID	[COG5630] Acetylglutamate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.171523
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGACAG GGAGTTCCGG GAAGGCATTC ATCTTATCAA TCTTGCAAGC TTCTCCTTCA 
GCCAGAGACT CTCGTTCTTA TCTGTCTTCA TTTGCTCCTC CTCAGCCTGC CGACATTGCT 
ACTGCAACCC CTGCCGCCAC TCCATCAGAC GGTGCTCAAC CTCCTGCCCA AAACCCTCTT 
GTCAATGCCC TTCTCAATCC TATTCTTCGT CGGCCTGCCC TTGTCAAAAT TCAAGGTCCA 
TTTACCGACG CGCAACTTGA ATCCATTTGC CGCGGCATGG CGCATCTTCA AAAATTAGGA 
CTCGTTTCTG TCATCGTCGT TGACCGTGAT GACTTGCCGT CTACGGAATC TTCCGACCGT 
TACGAAGCAC AGAGACAAAG GGCGATTGTC AGGCATGAAG TCGAAAGGGT TGTGCATTTC 
CTCTCAAGGC ATAGGGCAGC CGCCAGACCA GTCTTTTCAA CTGTTGCAAG GATCGCAGAC 
CCTGAGCTGG AGCCAGAGGA GGCACAAAAG GGTGTATTTG TTGAAGAGGA AGGACTTGAT 
CACGTGCGGA GGGCCGTGGG TGAGGGCGAA ATTCCCGTAT TACTGCCCGT CGCACTCGAC 
TCTGGCTGTC GTTCCCGGAG GATCCCAGCC AACAGAGTGC TTTTGGCTCT TGCTTCTGCA 
ATGTCAACAC ACACTTCCAG CCCCGTGGAC CTTACTCCGA GGAGGTTACT GGTGATCAAT 
CGTGAAGGCG GTATCCCTTC TTATGCTCGA CAAGGTCTGC CACACTTATA TATCAATCTC 
GCGTCCGAGT TTTCCTATAT CAACCGTACA TTTCAACCCC AATGGAATGA TTCCCATCCT 
ACTGCCTTGT CAAACCTCTT TCTCGCCAAT GGCTGCCTCG CCCACATGCC TCGTGAAGCG 
TCTGCTTTGA TCGTCTCCCA TCGATCTCCC GCAGCCTTGA TTGCGAATTT AATCACCAAC 
AAGCCCGCAC ACTCTGCTTC TTTGCCTCAT GCCCTGCTTG TCGAGTCTGA GGGTCGTATC 
ACTCGTGATA CACCAACACT CATCCGTAAG GGCCTTCCAG TTCGCGTCTT GCGCAGCATG 
GAAGAAGTCG ACCAAGACAA GCTCACACAT CTGCTTGAAA CCTCTTTCAA ACGCACACTT 
GATCGCGAAG GGTTCTACAA CCGTTTAAAG AATGATCTTG ACTTTGTGAT TGTGATTGGC 
GATTATGCCG GTGCTGCTGT TTGTACCCTT GAAGGCAAAC CCGTTTCTGA TTCATTCGCT 
TACCCCCCAA ATCATCCCGA ACCTATATGC TACCTTGACA AATTTGCCGT TCATCCTTCA 
CACCAAGGCG ATGGTACAGT TGATTTCTTG TGGGTCGCTC TTCGTGATGA GACGTACGGT 
CTCGGTCAGT TGGATGCCTC AAACCCGTCT ATCGGTTCGT TGAGAGGTGT CGGCAGGGGT 
AGAGATCTTG TCTGGAGGAG CAGAAGTGAT AATCCCGTCA ACAAATGGTA TTACGAGAGG 
TCAAGTGGCT TCCTGAAGAC AAGGGACGAG AAGTGGAAGG TATTTTGGTG TGATGCGGAG 
CAGAGGCTGG GAGAGATTTG GCGAGAGAGG GAATTTGGCG GAGGAAGATT GGTTAGAGTT 
GTGGAAAAGG AGGAAAAGGG AAGGGTGAAA TGGTGGGAAG AGGTCATCGG AGCGATCCCA 
TCAGCTTGGT CGGCGTAA

Protein sequence

MLTGSSGKAF ILSILQASPS ARDSRSYLSS FAPPQPADIA TATPAATPSD GAQPPAQNPL 
VNALLNPILR RPALVKIQGP FTDAQLESIC RGMAHLQKLG LVSVIVVDRD DLPSTESSDR 
YEAQRQRAIV RHEVERVVHF LSRHRAAARP VFSTVARIAD PELEPEEAQK GVFVEEEGLD 
HVRRAVGEGE IPVLLPVALD SGCRSRRIPA NRVLLALASA MSTHTSSPVD LTPRRLLVIN 
REGGIPSYAR QGLPHLYINL ASEFSYINRT FQPQWNDSHP TALSNLFLAN GCLAHMPREA 
SALIVSHRSP AALIANLITN KPAHSASLPH ALLVESEGRI TRDTPTLIRK GLPVRVLRSM 
EEVDQDKLTH LLETSFKRTL DREGFYNRLK NDLDFVIVIG DYAGAAVCTL EGKPVSDSFA 
YPPNHPEPIC YLDKFAVHPS HQGDGTVDFL WVALRDETYG LGQLDASNPS IGSLRGVGRG 
RDLVWRSRSD NPVNKWYYER SSGFLKTRDE KWKVFWCDAE QRLGEIWRER EFGGGRLVRV 
VEKEEKGRVK WWEEVIGAIP SAWSA