Gene CNE01140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNE01140
Symbol
ID	3257788
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006687
Strand	+
Start bp	316959
End bp	318558
Gene Length	1600 bp
Protein Length	346 aa
Translation table
GC content	46%
IMG OID	638256702
Product	conserved hypothetical protein
Protein accession	XP_570702
Protein GI	58267092
COG category	[R] General function prediction only
COG ID	[COG1355] Predicted dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.599641
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGGGT AGGCTGCCAA CTTTTTGAAA TTCTAAATAC AGGGCTAACG ACAATATCCA 
GCGTACGCGA AGCCACCCAC GCAGGCAGCT GGTACACCTC TTCCCGTACG TCTTTCCGCT 
CATCGCTCCT TCCGTATCCA GCCATATTAA TCTAATACAT ACCATATGCT AGGCCCTGGG 
CTTCATAAGC AACTTAGTCA GAACCTTTCT GCAGTCAAAC CTATCTCTAC ATTAGATTAC 
GACCCACCCG TAAGCAATGC TAAAGCGATC ATTGCGCCGC ATGCGGGATA TAGCTATTCG 
GGACCTGCCG CAGCGTGGGC TTATGCGGCT GTACCTACAG AGAAAATGTG AGTCACTCAA 
ACTGTGAAGC CAACTGTGAT GAGGGTATGG TGATGCTAAT AGGAAGGGAT CATTTGCCGC 
TAAAGTAAGA GAGTATTTTT ATTGGGCCCT TCGCATCATG CCTACTTGCC GGGGGTAGCG 
CTTTCCAAGT TTGAAGCGTA TGAGACGCCT TTAGGGGATA TTCCTCTTGA TACAGACAGT 
GATTACTCTG CAATTTTGAT ATGTAGTATA CAGACCGCTA ATGGACTCGA TAGCTATCAA 
TGAACTTCGC GATACAGGGA TATTCTCTGA CATGAAATCC TCTACTGACG AGGACGAACA 
TTCGTTGGAG ATGCATTTGC CCTATATTAG GTTGATCTTC CAAGGGTGGG TTGTCTTCAC 
GGACTGTCTG AACTATGACC ATCTGATCAA TTTACAGGAG GGATGATCTC AAGCTTGTTC 
CGATCCTCGT GGGACACCCC AGTGCTTCGA CCAGTGCAAA GCTCAGTGAA GCTCTTGCCA 
AATACTGGCA AGATGGTGAG ACCTTCTTTG TGATCTCCAG CGATTTCTGC CACTGGCAAG 
TCATTCATCA TGTCTAATCC ACAGAAAACG ATGGCTGATG ATAAATCAGG GGGAGCAGAT 
TCTCATGCAC TCCATACTAT CCAAACATCC CGCCTTTGGC CAATCCCGTG CCTCCCGTCA 
AATCGTCCAC TTCAGCCACT CCTGGCACTC TCACCCAGCC TCCTGAGCTT GTCAAAAAGT 
TTTCTTCCGC CAGCTCCAAT CCGGATGTGC CTATCTGGAA GTCTATCGAG TACATGGATC 
ATGAAGGTAT GGACCTTTTG CGCAAGCCTG GAGAAGATGG TGCTGTTGAG AAGTGGCATG 
GGTACTTGGA AAGGACCAAG GTTTGTCTGT CTATCAACAA TTTTGGTCCA TCATCTGAAA 
GACATTTTAG AATACAATTT GCGGTCGAAA TCCTATTACT GTACTCCTCA ATCTCGTCCA 
GTTTGTGTAC AAAAATCAAC CGGTTAAGCC CGAGTTTGTT TTTGTAAGGT ATGAGCAAAG 
CAGTAAATGT GTGAATGGAA AGGACAGTAG CGTCAGTTAT GTTAGCGGGG TCTTAAGGCT 
CCCTCAGTGA TTCCTAGTCC ATATTTGGGC GTACGAGTAG TGAGACTTTT TACTGGTGTA 
GGTTGGATCT GGTTGTAAAG GAAGGCGACA GACGATAAGA ATAAAGTTGT AGAGCTGAAG 
AATTCGAATT CCCGAATGTA AATATACATG TATCCGTCTC

Protein sequence

MSGVREATHA GSWYTSSRPG LHKQLSQNLS AVKPISTLDY DPPVSNAKAI IAPHAGYSYS 
GPAAAWAYAA VPTEKIKRVF LLGPSHHAYL PGVALSKFEA YETPLGDIPL DTDTINELRD 
TGIFSDMKSS TDEDEHSLEM HLPYIRLIFQ GRDDLKLVPI LVGHPSASTS AKLSEALAKY 
WQDGETFFVI SSDFCHWGSR FSCTPYYPNI PPLANPVPPV KSSTSATPGT LTQPPELVKK 
FSSASSNPDV PIWKSIEYMD HEGMDLLRKP GEDGAVEKWH GYLERTKNTI CGRNPITVLL 
NLVQFVYKNQ PVKPEFVFVR YEQSSKCVNG KDSSVSYVSG VLRLPQ