Gene CNK01780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNK01780
Symbol
ID	3254658
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006680
Strand	-
Start bp	523211
End bp	524660
Gene Length	1450 bp
Protein Length	337 aa
Translation table
GC content	47%
IMG OID	638253671
Product	conserved hypothetical protein
Protein accession	XP_567657
Protein GI	58260494
COG category	[R] General function prediction only
COG ID	[COG1741] Pirin-related protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.293563
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAGGA CCACACTTAC ACGTTTCAAC ACTTCATCAA GTCTAACCAC ACTCAAAGCA 
AACATGTCCA CCACTGCTGC TATCAATACC GCCACCGGCA CTTCTCGAAG TATTACCAAG 
ACTGTTTACG CTCACGAGGT CTCTGAAGGT GCCGGTGCCA CTGTCAGGAG GTCTATCGGT 
ACTAGGGAGC TTCGGAATCT TACTCCTTTC TTGATGTGAG TCACTTTCAG CTGTTGAGGT 
GCAAGACTTG GAATTTGGGA CATCGACACC AAGGAATGGA GACCTTACCC AAACTCACTT 
GAGGGTATGC CCGGACAAGT GATCGAGATT CCGATAGGAG TCAACTATCC AGATCCGAGA 
AAGACTAGCC CCTTAATGAC TCATTCGTAA ACTTGACCCG ATATTTGTAT ACTGACTTCC 
TCTCACAGGC TCGATCATTT TAAAGTCCTT CCCGGTGCTG GTTTCCCCGA TCACCCTCAC 
CGCGGTATGC AAACTGTCAC TTACTTGTTC CGAGGTATCT TCAAGCACGA GGACTTCCTT 
GGATACTCTG GAACGTAAGT TTTTTTCTGT TTGAAGCTAT TTCTTTGTAA TATTACCTGC 
TGACACGATC GCTTTAGTTT AACACCCGGA GATGTTCAGT GGATGACAGC CGGTAAGGGT 
ATCGCCCACG CCGAGATGCC TATATTTGAC CCGGACCCAA CTAAGGCTGA GCCTGTTGAG 
GGTATGCAAC TTTGGATTGA CCTTCCCCAG AAGGAGAAGT ACATTGAACC AGAATACCAG 
GACCGAAAGG CTGAAGAGTA AGTCTGAATG ATTAAATTTT ATAGTAGTGG TTTTGCTGAT 
ATATGCGTAG TATTCCTGTT ATCCACCCTA AAGATGGAGT AGAAATCACT GTTCTTTCTG 
GTGACTCTCA CGGTACCAAC GGCTCTGTTA CTCCGGTCGG CGGTGCTTGG TACTTGGGTT 
TCAAACTTCA GAAGCCCGGG GCGAGCGTGT ATCAGCCTCT TCCTGAAGGT TACAATGCCT 
TCATCTATAG TAAGCCTTTT TAATCTCATC GTACTGACCT ACTACTGACA AATACTAAAA 
CAGTCGTGAA GGGAAAGCTG CAAATCGGCG ACGACACCAA GACTCATGAC AAGTTCAACT 
TGCTTGTTCT TTCTTCCAAG CCTGGAGAGT CTGGCGTGAC CCTTACCAGG CCAGAAGACG 
ACACTGATGC TGAAGAAGCA CATTTTGTTG TCATTGCCGG AAAGCCTCTC GACCAGCCTA 
TTGTTCAGGT GAGTCAGTTT CTCATGTGTA AGATGATGAT GTGTTGACAG CCCTTTTTCA 
GTATGGCCCT TTCGTCACCT GCAGTCAAAG ACAGGCTATG GAAGCAATTA TGGACTATCA 
GACAGGGAAG AATGGGTTCG AGCGTGCTGT TGGTTGGAAG AGCAAGATCG CCAAGGATTT 
CAGGGGTTAA

Protein sequence

MLRTTLTRFN TSSSLTTLKA NMSTTAAINT ATGTSRSITK TVYAHEVSEG AGATVRRSIG 
TRELRNLTPF LMLDHFKVLP GAGFPDHPHR GMQTVTYLFR GIFKHEDFLG YSGTLTPGDV 
QWMTAGKGIA HAEMPIFDPD PTKAEPVEGM QLWIDLPQKE KYIEPEYQDR KAEDIPVIHP 
KDGVEITVLS GDSHGTNGSV TPVGGAWYLG FKLQKPGASV YQPLPEGYNA FIYIVKGKLQ 
IGDDTKTHDK FNLLVLSSKP GESGVTLTRP EDDTDAEEAH FVVIAGKPLD QPIVQYGPFV 
TCSQRQAMEA IMDYQTGKNG FERAVGWKSK IAKDFRG