Gene CNI03700 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNI03700
Symbol
ID	3259635
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006694
Strand	+
Start bp	998312
End bp	999482
Gene Length	1171 bp
Protein Length	299 aa
Translation table
GC content	47%
IMG OID	638258865
Product	conserved hypothetical protein
Protein accession	XP_572597
Protein GI	58270882
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG5285] Protein involved in biosynthesis of mitomycin antibiotics/polyketide fumonisin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.183271
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCTATT TAACAGAAGA GCAAAAGCAG CGATGGAAAG AGGACGGTTA CCTCGTTTTG 
CCCTCGTTCT TCACTGACGA GGAAACCAAG GATATGCTCA ATGAGGCCAA GAGGCTTTGT 
GGCGAGTTTG ATATTGAGGG GCACCCTATG GTATGTGCTG TTGATTCGTA CTTATTGAGC 
TTCAGACAGA TTGATTCTAC TATAGACGAC ATTTAAGACA GCGGCGGATG ATGCACATAT 
CGGAGATGAG TACTTTTTAA ACTCTGGGGA CAAGGTGAGC GAGCCTTTTG ATACCGTTCT 
ATTACTCACC ATAACATGAG GTAGATCCGT TACTTTCTTG AACCAAGTTC CGTTACCCCA 
GCTACTGCCA CTACACCTGC CAAACTCCTC GTGCCCCCAG CTCAATCAAT CAACAAGATC 
GGCCATGCAC TCGCCGTCCT CAACCCAGTT TTCCGCAAAT ACACACTAGA AACACCAAAG 
ATGTCGAACC TAGCAAAAGA ATTGGGAGAA CAAGAGAGTC CGAGGGTGTT GCAGAGTATG 
GTTATTTGCA AGCAGCCGAG AATAGGCGGT GTTGGTGAGT TTTTGCGGAA CGGTTTGGTG 
AGATATCGTT GCTGACTAGG CAGGCAGTTC CTTGTCATAA TGACTCTACT TTTTTGTACA 
CTGATCCTCC TAGCGCTATA GGTGCATGGA TAGCTCTGGA AGAATGTACA CCTCAAAACG 
GCTGTCTTGT ACGTCCGATT CATAACGCTA CCTGATGTCT ATAGCTAATG TAGGGTTGGT 
CAGTCCTTTT TACCAGGCTC TCACCGATTA TCACGAACTT CAACTCGATT TGTCCGTGCG 
CCCAATGGCG GTACGACTTT TGTCGATGTC CCTGGGGTGG AACCAAATAC GGAGAATTGG 
GATGAGATGG AAGGCTGGAA AGAAGCGGCT TGTCCTCCTG GGACTTTGGT TTTGATCCAT 
GGTGCGTCGT TGAGTCTAGA CATATATCCT GACGCTTCGA GCTAATGTGA TGCGTGCAGG 
AAGTGTGATG CACAAGTCTC CTCCTAATCC TTCGGATAAA TCGAGGCTGA TTTATACATT 
CCATATGATT GAGGGAGGGA AGGGTGTCAA ATATGATGAG CGAAATTGGT TGCAGCCGAC 
TAAGGAAATG CCATTCCCTG CTTTGTTTTA G

Protein sequence

MPYLTEEQKQ RWKEDGYLVL PSFFTDEETK DMLNEAKRLC GEFDIEGHPM TTFKTAADDA 
HIGDEYFLNS GDKIRYFLEP SSVTPATATT PAKLLVPPAQ SINKIGHALA VLNPVFRKYT 
LETPKMSNLA KELGEQESPR VLQSMVICKQ PRIGGAVPCH NDSTFLYTDP PSAIGAWIAL 
EECTPQNGCL SFLPGSHRLS RTSTRFVRAP NGGTTFVDVP GVEPNTENWD EMEGWKEAAC 
PPGTLVLIHG SVMHKSPPNP SDKSRLIYTF HMIEGGKGVK YDERNWLQPT KEMPFPALF