Gene CNG00020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNG00020
Symbol
ID	3258654
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006692
Strand	+
Start bp	3211
End bp	4659
Gene Length	1449 bp
Protein Length	183 aa
Translation table
GC content	48%
IMG OID	638257614
Product	hypothetical protein
Protein accession	XP_571718
Protein GI	58269124
COG category	[R] General function prediction only
COG ID	[COG5271] AAA ATPase containing von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.686504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCACCG CCCTCGTCAG CGGGCAAAAG CAACATCCTG AGCGCTTCCT TTGCCAGTTC 
AGGGGCACTC GTCCTCGATG CAGCAGCTAC GTGTATTCTT CGGTGTTTAA GTTCGGCGAG 
GATAGAGGGT ACTTCATGGT AGAAAGAAAG ATTTTGTCCA CGCCTGCATT CCGTGAGTAG 
CTTGTTACGC GAGCGTACAA AAGAGACAGG GACGAAAGAC TCACCGATCG ACAAGCTGGT 
TAACAACGTC TCCATTACGC TTGAGTGGAG GAATAATATG CGTCTATTGA CCATTCTTCG 
TTAGTGCTCG TCTCCTAGTT GACAATACGT CGCCCCGTGA AACGCAACGC CCAAACATAC 
ATCTATCCAC AGATCCCAAA GGGTATAACT GGTGCATTGG ATATATCAGC CTGCTTATCA 
GGATATTATT AAAAAAGTGT AGATACTCAA GGTCGAACGC CACAAGTAGA GGGTAAGCAT 
CCAGATCATT CGGCGAAACG GTTCGATACT TTTCGGCAGG TGGTGAAGGT TCGCGGCGGG 
AGGCGGCTCT TCGAGGCATC GTTTGGACTT TGTGAAAATG TAAATTAACG AGCTTTCTAC 
CCTGCCCGTA AGTTGAAAGG TATTGAATAC GTGAACGAGG TGTAGTTGCA AGTCTCAAAT 
GTAATGGCGA TCTTTCGATA TGTGATTCGG TCCGTCGTTG GGTCGTTGTT CGTGCTTTCT 
TCGATCCAGT GAGAACAAGT GATGACGTAA GGGTTTTTTT ATTTTCTCAC GGTCGACTTC 
TGTTTATCCC CCGGGCAATG TCTCCCGATA GCGGACGGAC CTTGAGTTAA GCCTTAAGCC 
TTAGATTGTT GCACCTCGAA GAACATCCTG TAAATAATCG ATAGCCCTCG TAATTCCAGG 
AGCAAACAGT GAATATTTAT CATTATGGCT GCTGAAAAAC AACAACAACG TATGACCTAG 
CCCCTCTTGA AAGTTCGTCT CTCGCTAATT CGGTTGTGCA GCCTTGCCTC TTGGGAAACC 
TGTTCCCGCT AAAGAAGGAG AGGAGAAAGT GGAATTGAGT GATGAAGGAG ATGAAGACAG 
AGAGGATCTT GAGGAGGAAA ATGATGAAGA CTTCGATGAG GACGAAGACG AGGACGACGA 
GGATGAGGAT GAGAATGAGA ATGAGAATGA GAATGAGGAT GAGGATGAGG AAGACGAAGA 
CGAAGAGGGC GACGATGGTA TTGACCACAA GAAGGTGCTG TCGGACTTTT ACAATGTAAG 
GCCTAGGGCC TTGCCACAGG ACCTAGTATG ATATCGGAAC TGTGCTAATG GGCCGTTTGG 
TAGACCGAAC AAGTGGACGA AGAGGATGAT GAGGATGTCA TCGAAGGCAA AGAGGATGCG 
GGAGTCAGCA ACCTGAAGCG AAAGGCGGAC GGTGAGGAAC ATGGCGAGGC AAAAAAAAAC 
AAGGCCTAG

Protein sequence

MVTALVSGQK QHPERFLCQF RGTRPRCSSY VYSSVFKFGE DRGYFMVERK ILSTPAFPLP 
LGKPVPAKEG EEKVELSDEG DEDREDLEEE NDEDFDEDED EDDEDEDENE NENENEDEDE 
EDEDEEGDDG IDHKKVLSDF YNTEQVDEED DEDVIEGKED AGVSNLKRKA DGEEHGEAKK 
NKA