Gene CNF04100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNF04100
Symbol
ID	3258216
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006691
Strand	+
Start bp	1187850
End bp	1189520
Gene Length	1671 bp
Protein Length	482 aa
Translation table
GC content	48%
IMG OID	638257528
Product	conserved hypothetical protein
Protein accession	XP_571711
Protein GI	58269110
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.075511
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGATA CAGCTGCTAC GCAAAGCTTT ACCTTCCTTT CTACTCACAT TGATGACCTA 
TCAGTCTGCC ATAATATGGC AACCTCCTTT ATCCTTCTTC CCACTTCGCT GTGTTATGAA 
ATTGAATGGA AAGATACATT CGTCCCTGAC GAAACATTCA TGATGAATGG CCATCCCTCG 
ACATCCACAT CCAAAAAAGA AGATAGACCT TTAGAAATAC TAATCATCGG TGCGGGAGTT 
GCAGGAGTGA CAGCTGCATA TGCTCTTCGC CAAAGTCAGG CATACCAAGA AGGAAAGTTG 
GTCGTAAGGC TTGTCGAAAA AAGGAGTCGT AAGTCCACTT AGGTAGGTTG GCTGGCTGTG 
GAGAGCTGAT GGGATGAGAT ATGTGAAGAG GAAACATGGG GAGGGAGAAT GGGATTTCCT 
ATGCATTTGA CCAAGGTCAG TCATGTTTTC TCAGCTTACT TACCAGAACC ACTCACATTG 
GCAACGTACA CAACGTAACA GGCCGCACGT AAAGCCCTAG ACGATCTGCT CATCCCTTCA 
CACAGCACTA AACTTCTTGT CCTTCGACAA AAGATCCCCA TTCTACATGA CGGCTTGACT 
GTGCTTTCAT ACAGCGGTAA AATGGTGTAT CGGATGGTTC GCGATGTTCG AGGATGGGGG 
ATGGTGGAGA GAGCCGACTT GATTAGTATT CTGAAAGAAG GAGCAGGGGA AGTGGAGTGG 
GACATCGAGG CGCTTGTAGG TGAGCCTGGG ATGGAAAGAG GGATCGAGGT TTGTCTGAAA 
GGGAAAAAGG AGGAGGTGGT AAGACCTGAT TTGATTGTCG GTAAGCCTCT CATTGTTCTA 
TTTCAAGGCC TGGCTTCTGG ATTAACCGCT TACATGATAA AGGTGCCGAT GGGATGTTCT 
CGGCCATTCG GCATTGCCTG TACTCTGATT CCCAAATGGT TGAGGATAAA CTACCGGGAG 
GTTTCAGCAA GCTCCCCCAA ACGATCATAA ACCTTCGAAC AACCTCGCCT GCCATGCGAA 
GATGGGTTCA CGACCCAAAT GGCATGAACT TGTTATACGG CGAATCCTTT TCTGCCACCA 
TGATGCCTCT TTCATTCCCT AGTATTTACG TCGCACTCAC CATCCCCTCA CAATGGCTCA 
ACCCTTCATC CCAGGTTAGA ATGAAGGGTG AAGAAATAAA GCTGGAGCCT ACGGTGCATG 
GGAAGTTTCT GAGACAGTTG GAACGTGATC CAGGATGGGA AAAGAAGGAA ACGTACCCGT 
TATGGAGTGC CACTAGCACG GTAGGGGGTA AAGGAAGAGT AGTACTAGTG GGTGATGCAG 
CTCATGGGAT GCCGCCATTC TGCGGGGCGG GAGCTAGTGC TGGGGTCATA GATGCCGTAG 
AACTTGCCAA AGTCATTGTG GATCATCTAA ACGGTAAGTC ATTCAGTCAT TAGGTCAGTA 
CTCAAAGGAG TAGATCCAGT AAACAATCTC GACGATGTAT TGCGGGGATT CCGAGAGAGC 
ATGAAGAAAC GCAATGACCC AATTATACGC CAATCCAAGA GGATTCTGTG GCTGGTACAA 
GCCGAGCGAT GGTATGAGAA TGCAATCCGG CGGGCAGTCT TTTTTATACT GGACCTGGGA 
GAGAGAATAA GTGCGCAGCG GGGCAGGAAG GTTGCTGCTG CAAGACCGTG A

Protein sequence

MSDTAATQSF TFLSTHIDDL SVCHNMATSF ILLPTSLCYE IEWKDTFVPD ETFMMNGHPS 
TSTSKKEDRP LEILIIGAGV AGVTAAYALR QSQAYQEGKL VVRLVEKRSQ ETWGGRMGFP 
MHLTKAARKA LDDLLIPSHS TKLLVLRQKI PILHDGLTVL SYSGKMVYRM VRDVRGWGMV 
ERADLISILK EGAGEVEWDI EALVGEPGME RGIEVCLKGK KEEVVRPDLI VGADGMFSAI 
RHCLYSDSQM VEDKLPGGFS KLPQTIINLR TTSPAMRRWV HDPNGMNLLY GESFSATMMP 
LSFPSIYVAL TIPSQWLNPS SQVRMKGEEI KLEPTVHGKF LRQLERDPGW EKKETYPLWS 
ATSTVGGKGR VVLVGDAAHG MPPFCGAGAS AGVIDAVELA KVIVDHLNGV DPVNNLDDVL 
RGFRESMKKR NDPIIRQSKR ILWLVQAERW YENAIRRAVF FILDLGERIS AQRGRKVAAA 
RP