Gene CNG02670 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNG02670
Symbol
ID	3258653
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006692
Strand	+
Start bp	747495
End bp	749525
Gene Length	2031 bp
Protein Length	492 aa
Translation table
GC content	50%
IMG OID	638257889
Product	conserved hypothetical protein
Protein accession	XP_571930
Protein GI	58269548
COG category	[I] Lipid transport and metabolism
COG ID	[COG3425] 3-hydroxy-3-methylglutaryl CoA synthase
TIGRFAM ID	[TIGR01833] 3-hydroxy-3-methylglutaryl-CoA-synthase, eukaryotic clade

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.250048
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTGCTCTATA GCACTTTACA CTCCTTACCC GCTCCCATAA TCCCCATTCC ACCGAAAATG 
TCCAACTTTG ATATCCCCGC TAGGCCCAGC AACGTCGGTA TCCTCGGCAT GGAGATGTAC 
TTCCCCAAGA GGGTGAGTGT CGCCACTATC AACTTACTCC TCTTCTGCAG CTAATTTCGG 
CGCATCTAGT GCATTTCTGA GGAACAGCTC GAGGAGTTTG ACGGCGTTGC CAAGGGAAAG 
TACACTATTG GTCTGGGTAT GGGCCACATG GCTTTCACTG ACGACAAGTG AGTTTGTCAA 
GTAATCGCGA TGGTCAAAAT AGCTGACAGT GCAATAGGGA GGACATCAAC TCTGTCGCCT 
TGACCGGTAA GCACAAAGTA TAGGCATTGA TGAGACAATG CTAACTTTTT GCAGTCGTTT 
CTTCTCTTCT TAAAAAATAC AATGTCGACC CCAGGTCTAT CGGTCGCTTG GACGTTGGTA 
CCGAGACCCT TATCGACAAG TCCAAGTCTA CCAAGACTCT TCTCATGAAC CTCTTCGCCG 
AGTCTGGTAA CACTGACATT GAGGGTATTG ATTCCAAGAA CGCGTGCTAC GGCTCTACCG 
CCGCCCTTTT CAACGCTGTC AACTGGATTC AGTCTGAAAG CTGGGACGGA AGGAATGCTA 
TTGTCATGTG TGGCGACATT GCCATTTACA AGGAGGGAAG TGCTAGGCCT GTGGGTGGCA 
TGGGTGCTTG TGCCATGTTG ATCGGTCCCG ATGCGCCTTT GGTGGTTGAG CGTGAGTGCT 
AGTCAAGCCC AGAGAGATAT TGTTTGCCAA CTCATTTGCA GCCGTCCACG GTACTTACAT 
GGCCAACACC TGGGACTTTT ACAAGCCCGA CCTTTCCGCG GAATACGTAT GTGCAATTCT 
CATGTCGTAC GATAGGTCAC TGACGCTGCT ATAGCCCACC GTTGACGGGC CCTTAACCAT 
TGCGGCATAC CTCGGTGCCC TTGACAACGC CTACTCTACT TACGTCCAGA AGGCGGAGGC 
TTCCCAGGCT CGTGCCGCCA AGAAGCTCTC TCTTGCTTCT GTGACCGCTG CCGTTTCCGA 
AGTTGCTAAC GGTATCGTCG GAGCCGTCAA TGGCCACGCC AATGGCCATG CCGAGACCAA 
GGAAGACGGT ATCGCCAAGT TTGACTATGT CTGCTTGCAC AGCCCTTACG GCAAGCTTGT 
CCAGAAGGGT CACGCCCGTA TGTTCTACAA CGTAAGTCAA TACATTCCGT TCGAACCATA 
TGGAAACTAT GAAACTTATC CTTTTGGCAG GACTACCTCC GAAACCCCTC TCATCCCGCT 
TTCGCCAACG TCCCTGAGGA CGTCAAGTCC CTCGACAAGA CTAAGACCTA TACCGACAAG 
GTCATTGAGA AGACTTTTAT TGGTATCGCT GGCGACCATT ATAAGTCTGC TGTTATCCCT 
GGCAAGGACT GTGTCTCTCG ATGCGGTAAC ATGTACACTG CTTCTCTTTA CGGTGCCCTC 
GCCTCTGTCG TCTCTTCCGC TCCTGAAGGT ATCGAGATTG GCAAGCGAAT CGGCATGTAC 
GCCTTTGGTT CTGGTTGTGC CGCTTCTTTC TACGTTCTCA AGGTCAACGG TTCTACCAAG 
GAAATTGCGG ACAAGTTGAA CTTGAAGGCG AGATTGGCTG CTATGGACGT CAGGCCTTGT 
CAGGAATATG TTGATGCTCT CAAGGTAACT ACTCATGTTC ATTTCTTGTT GGGGACAATG 
ATTGGCTGAC GATGTCACAG CTCCGAGAGG AGAACCACAA CGCTGTCAAG TACGCTCCTC 
AAGGCTCTCT TGACAACATC TGGCCTGGTG CCTACTACCT CGAGGGTGTT GACGATCTCT 
ACCGACGAAC TTACCTTCAA AAGCCTGAAT CTGCCCAAGT ATAGAGCGTA TTGTTTGTTA 
TAGAGGGTTA TTCTGAAATG TGGCTAGACG GACAATCTGT TCGGTTGCTT TTGGGGACTT 
TACATGTAGT TTATATACCG AGTGCATAAT GGATATCATT GGCATAGTTT G

Protein sequence

MSNFDIPARP SNVGILGMEM YFPKRCISEE QLEEFDGVAK GKYTIGLGMG HMAFTDDKED 
INSVALTVVS SLLKKYNVDP RSIGRLDVGT ETLIDKSKST KTLLMNLFAE SGNTDIEGID 
SKNACYGSTA ALFNAVNWIQ SESWDGRNAI VMCGDIAIYK EGSARPVGGM GACAMLIGPD 
APLVVEPVHG TYMANTWDFY KPDLSAEYPT VDGPLTIAAY LGALDNAYST YVQKAEASQA 
RAAKKLSLAS VTAAVSEVAN GIVGAVNGHA NGHAETKEDG IAKFDYVCLH SPYGKLVQKG 
HARMFYNDYL RNPSHPAFAN VPEDVKSLDK TKTYTDKVIE KTFIGIAGDH YKSAVIPGKD 
CVSRCGNMYT ASLYGALASV VSSAPEGIEI GKRIGMYAFG SGCAASFYVL KVNGSTKEIA 
DKLNLKARLA AMDVRPCQEY VDALKLREEN HNAVKYAPQG SLDNIWPGAY YLEGVDDLYR 
RTYLQKPESA QV