Gene CNG02950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNG02950
Symbol
ID	3258931
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006692
Strand	-
Start bp	812368
End bp	813820
Gene Length	1453 bp
Protein Length	351 aa
Translation table
GC content	51%
IMG OID	638257918
Product	conserved hypothetical protein
Protein accession	XP_571984
Protein GI	58269656
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGAGACTTGT ACTAGGCGTT GAGATACCGA TACACCACTT CACCAAAAGG AGTTAATTAA 
GGTAAGCGGG CCGTTTTGGG TCCGGTGCCT CTTCGGGCCG GAGCTACCAT GGAGGGGCCG 
GCTGGTTGTT TTCGGGCATG GGGGATAGCA GAGACACTCA TCTCTATAAA ACCCCCAGCT 
GCAATACGCA TCAGTAGCTT TCCCTCGGTA CATATCCCTA TTACGAGTAT ACACTACTGA 
AATCAATAAT GTCATCGCTC AACGGTCATT CCAACGGCAG CAAAGGTGCC ACCCACAAGA 
GAGTGCTCAA ACCAGGCGTC TGGGCCCCCA TCCCCACTTT TTTGGATGAC AAGGAGGAGC 
TTGGTGAGTG GTAATACCTA AACTTTACAA ATTTTCCGAA ACTTACTCGA TAACTGGAAA 
TGGTTTAGAT ATCTCCACCT TCAGAAAACA TGTTGTTGAT CTTGCTAAAA TCGGCATGCA 
GCCTGTCATT TGCGGGTCGA TGGGTGAAGC TTTCCAACTC ACAGACGATG AACGAGTAAC 
TCTCTTCAAG GAGACCCGGG CTGCTCTGGA TGAGGCTGGG TTGCTCGACA CTGTGGTGAT 
CGCCGGAACG TAAGTTCAAT ATTAAACGCA ATCGACCAGG ATGAGCTAAT CATCAAGTAG 
AGGAGCTAAT TCCACTCGAG CGACCATCAA TCTCTGTCAT TTGGCTGCCT CTTCTGGTGC 
CGATGTTGCC ATCGTTATCC CGCCCGGTTA CTTCGCAGGA GCCATGACTC CCCTTGCCCT 
CAAGACCTTC TTCCTTGAAG TCCAAGCCTC TTCCCCCATT CCCGTTATGG TGTACAACTA 
TCCAGGTGCT GCTGGTGGCA TCGATCTCTC TTCCGACCTC ATCGAAGAGA TCGCCAAGAA 
AGGCTCCAAC ATTTGCGGCG TCAAGCTCAC TTGCGGAGCC GTAGGAAAGC TGACAAGGAT 
ATCTGCTGCT ACTGCCACTC CGGCCTTTGC AGACTATCCC AGGAAAAGTG ACGTCGCACC 
AGAGTTCCTC ACTCTTGGTG GGTTTGCAGA CTTCCTCGCG CCCGCCGTGC TGGGTGGTAG 
AGGCCATGGC GCTATCATGG GTCTGGGCAA CATCTATCCT CGTTCGCTTG CCAGATTGTT 
TGAGCTCTCT TACAAGATTG CCACAGACGC CCAGCCTTCT GCCCAAGATC TGAAGAAGGT 
TCTCGAGTTG CAAGATCTGG TTTCCGGTGC CGATGCATCC TTTGCAAGGG CAGGGATTGC 
TGGAACCAAA TGGTACCTCA AGACTCACAG TGGTTATCCC TCTGCAAGGT TGAGGCACCC 
CTTGTTGGAG TTTACGGATG AGCAAGGACG GGCATTGGAG AAGGAAGAGG CAGTTGTCAA 
GTTGATGGAA GTCGAGAAGA GCTTGGCCAA TAGCCAATGA AAGTTACACT AGAGATAGCA 
TTTATGTAAC AGG

Protein sequence

MSSLNGHSNG SKGATHKRVL KPGVWAPIPT FLDDKEELDI STFRKHVVDL AKIGMQPVIC 
GSMGEAFQLT DDERVTLFKE TRAALDEAGL LDTVVIAGTG ANSTRATINL CHLAASSGAD 
VAIVIPPGYF AGAMTPLALK TFFLEVQASS PIPVMVYNYP GAAGGIDLSS DLIEEIAKKG 
SNICGVKLTC GAVGKLTRIS AATATPAFAD YPRKSDVAPE FLTLGGFADF LAPAVLGGRG 
HGAIMGLGNI YPRSLARLFE LSYKIATDAQ PSAQDLKKVL ELQDLVSGAD ASFARAGIAG 
TKWYLKTHSG YPSARLRHPL LEFTDEQGRA LEKEEAVVKL MEVEKSLANS Q