Gene CND04750 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CND04750
Symbol
ID	3256965
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006686
Strand	-
Start bp	1303299
End bp	1304619
Gene Length	1321 bp
Protein Length	172 aa
Translation table
GC content	44%
IMG OID	638256411
Product	conserved hypothetical protein
Protein accession	XP_570495
Protein GI	58266678
COG category	[K] Transcription
COG ID	[COG1095] DNA-directed RNA polymerase, subunit E'
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.551706
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TCATCCATGC AGGGATAGAC ACCCAACTGT CATCCATCCA TCCGCCCGAA CTCTTCCCAC 
CTCGGTCCAC GGAAGGTATA GGATCATACC CATCTTTCTC TTTCCATCTT TTTTTTCCCC 
TATCAGGCCA GAAAAAGAAA AAAAAACTGC AAACAACCTC TCAGGATGTT CTTCCTGGTT 
GGTACCACCC TTGCGCGAAA GCCTTGCTAT TCGCGCTGAC ACGTTTACTG CTTTCTTTGC 
ATCCGAACCT GCCCGACTGT GTTTTTTCTC TGCCCGAAAA ATTTTGGTTG CATAGCGAGA 
ACTTACTCAT ACAATCCTAC TTCATCCATC CTACTTTGGT GCCCAGCTTG AAGACTATCT 
CCGTCAGAAG CTTTATGAGG ATGTTGAAGG AACGTGTAGC GGTAAACATG GGTATGTTGT 
TCATTTTCGT CACAGCTCGG ACGCTGACAT GGAGGATAGG TATATCATCT CGGTCATCAC 
CATAACAGAC ATAGGTGAAG GCAAGATCAT CCCATCGACA GGTCAAGCAA AGTTTAAGAC 
AAGGTATACT GCCATCGTCA TGAAGCCCTT CAAGGGTGAA GTAGTGGATG CCAAGGTTGT 
CAATGTCAAC AAGGCGAGTC TTTTGGCATC TGTTTTCACA TTGTCCGACG GCTGACTGTT 
TTGCAGATGG GCTTCTTTGC GATGGTCGGG CCATTACAAG TGTTCGTCTC TTGTCATGTA 
AGTCACAGTT TCATTTTCAC TTGCCCTCTT TGAGCATCCC CACCCCTCTC CATCTATGAT 
GAACATTATG CATAGGGACA ACAGATCTTT CGGGAATGTT GATTTATGCG GGACGATCTT 
GTAGTAATTG ATCGATTAGT TCCTGATCTT TTTATTTCCT TATTATTTCT AGAGTGCAAT 
GACTGAGAGT CTGATCAAAG TTTGCTGACT GCCCGATCCT CAGCTTACTC ACTCGGATAT 
GAAATTCGAC CCCAGCGTTT CGCCGCCATG CTATCGTTCA AATGACGAAA TTATTCAAAA 
GGATACCAAA GTGCGAATAC AAATTGTAGG TTGTAGAGTA GAAGCGAATG ATATGGTAAG 
TCTATACCAC TCGAACCGTG CTCCTGTTGC ATCCCAAACT GAGAGGTGAG TTCAGTTTGC 
GATCGGAACT ATTAAGAAGG ACTATCTTGG TCAAATAAGA GATGAGTAAG GTAATTATAT 
GGTATGGCTG TGTGCGCGAC ACCAAAGCAT AAATTTGGGA ATCCTTGTAT TAGACTACAT 
TAACATATAC ACACTATTGT CAGAAATTGA ATACAACATG CATAAATGAT GATGTAACCA 
T

Protein sequence

MFFLRELTHT ILLHPSYFGA QLEDYLRQKL YEDVEGTCSG KHGYIISVIT ITDIGEGKII 
PSTGQAKFKT RYTAIVMKPF KGEVVDAKVV NVNKMGFFAM VGPLQVFVSC HLTHSDMKFD 
PSVSPPCYRS NDEIIQKDTK VRIQIVGCRV EANDMFAIGT IKKDYLGQIR DE