Gene CNF00140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNF00140
Symbol
ID	3258468
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006691
Strand	-
Start bp	41651
End bp	44989
Gene Length	3339 bp
Protein Length	781 aa
Translation table
GC content	53%
IMG OID	638257135
Product	conserved hypothetical protein
Protein accession	XP_571284
Protein GI	58268256
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.505175
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCCCT CGCGCGACTC GGCACTCGCC TCCGCATCCG CCTCCCGCGC CCAGAGCTAC 
AAGGGGTCCC CCAGCATCAA CCCGCGGTAC TCGACCGGCA ACCCTGCGTC CACGCCGCCG 
TTAGCCGCGA ACGGCGTCCC CCCACCGCGG CCTAATCGCG CAGGCACGCT GCCGCTCGAC 
CTCTCGCTCG ATAGGGATCC CAGCCCGCAA CCTGCGTCTG CCCGCTCACC CGCCTCCCAG 
CTGCCGCCCG TCCTGCCGTC CCCCGCCGTA TCCCCCGGCG TATTCTCCCC GCCGACGCTG 
GGCCAGCCAT TCGCCGCCCC TGTTGGCCCC GCGCCTGGCA ACCCGTATTT CCCCAGCGCG 
ACCGCCGCGA TCGAAAAGGG CATGGAGGAC GTCAAGATGT CCGGCCCCGT CGGGGTCGGT 
GTACCCATGG GTGTCGTCGA ACCGAGAGAA AAAGAGTTGC CACGTGAGCC CGGGTCGGCG 
GCGATGGGCG GGAGAAGCAG GAGTGGGACC GGGAGGAGCA GTAAGGATAA AAAGAGCATG 
TTTGGGTTCG TCTCTGGTAC GTCTCTTTTC TCTCTTTCCC GAAGCGTTTT CTCGGGAGAG 
GAGATGGAGT GCTGACGAAC GAGGTAGATT TACTAGGCAA GGACAAGCCG CCAGTGATTT 
CGAAACCGTA TGATCCGGTG CATGTCACCC ATGTCGGATT TGATTTCCAA ACCGGAAAGT 
GTGCGTCCGG CCTTCTTTTT CTGGTATTGT GTGCACTGAC AAGCGCGATA TGTAGACACC 
GGTATGCCCC CCAAATGGCA GCAAGTCCTC GACGACAATG GCATCACCCA AGACGAGCAG 
GAACGAAACC CGAACGGCGT CATGGCCGTC GTGCAGTACC TGAAACATCA AGACGAAGGC 
GAAGATGAAG AAGAGGAAGT ATGGGCAAAG ATGAAGAATG CGCAACCGCC TGCGTTTCCT 
CCACCCTCTG CCGCGCCGTC GCAGCCGACA ACGCCGGGAG GAGGGGTCGG GAGTAGAGAG 
ATGAGTAGGG AACCGAGTAA TGAGGCGCTC GGCGCAGCGG GAACACAGGT GGTCGATTTC 
ACGTGTCCGA GAATGGCTCC TGCTCCGCCT ACCAAGCCGT CCCTCAACCG AATGCTCGTG 
TGTTTTTTTT TCCAATTGTA GATGGAAAAA GTACTGACAG ATATAGTCGG AACGACATGC 
GCCGGCTTCG CACCGACCGG CCGAACTCAC CACCCCTGCC CCTCTGGCAG CCGCTCCTAG 
GGTGACACAG GCGTATTCTT CCGCATTATC GCATTCACCC CACCTCCCAC CTCCTCATCC 
CACGTCGAGC GCTCCGCCGA CCGCGCCCGC GCCGCATCTC GATAGGTCGT ACTCCCAGCG 
TGCGCCGGTG TCTGGTACAA AGACAAAAGT GTTGGATCGG GCGAATACGA CGAGGTCGCC 
GGGATCGAGT GCGGGGATAG CGCAGGGCGC GGGCACGGGC GTGGGTTTGA CGAAATCGCA 
AAGTCAGTCG GGACATAAAT CGCGCGATCC ATCGAGAGAA CCAAAAGATT CAGCTTCTTC 
CTCTGGCGGA TTATCGAGAA ACCAAACGAC GACGCGACAG CAGCAAGGGG CGACTCCCCG 
TAGAAGGGAA AAGGAGAAGA AGGAGAATGA AGACGTGATA AGGCAGTTGA GGATGATATG 
TACACCCGGA GACCCGAATT TGGTGTACAA GAATTTCAGA AAGATTGGTC AGGGGTGCGT 
CCGATTGGTA TGCAGATGAA AACACGGAGG CTAACACGAA AACAGTGCGT CGGGCGGTGT 
ATACACCGCG ATAGATCGTC AAACTCTGCC GGTCGCTATC AAACAGATGA ACCTCGAAAA 
ACAGCCGAAA CAGGATCTCA TCATCAACGA AATCCTCGTC ATGCGCGAAT CTGCCCATCC 
AAACATTGTA AACTTTAAAG ACTCGTACCT CTGGCAAGGC GATCTGTGGG TGGTGATGGA 
GTACATGGAA GGAGGCAGTC TGACAGATGT GGTGACGGCG CATTGTATGA GTGAAGCGCA 
GATTGCGAGT GTGAGCAGAG AGGTTTGCGA GGGCCTGAGA CATTTACATA GTAAAGGGGT 
GATACATCGC GATATCAAGA GTGATAACAT CTTGTTATCC CTGAATGGTG ATGTCAAGCT 
TAGTAAGTTT GTTTCGATCT CTTATTTTTA TTCACTGCTG ACGATAAGAA ATAGCCGACT 
TTGGTTTCTG CGCGCGTATT GCCGACCCGA CGACGACGAA GCGGACGACC ATGGTGGGCA 
CACCGTATTG GATGGCGCCA GAGGTGGTGT TGCGGAAAGA GTATGGGCCG AATGTTGATA 
TTTGGAGTCT GGGTATTTTG GCGATCGGTA TGTCGTCTGG GTCGGGACTT GATTGGGCTA 
ATTTTTTTTT TTATTTAGAA ATGCTCGAAG GCGAACCGCC ATACCTTACC GAAAACCCGG 
TGAGGGCGCT CTACCTCATC GCTACAAACG GTACACCCAA AATCAAGGAT TGGGACAAGC 
TTTCGACCGT GTTTAGGGAT TACTTCAAGG TCACCCTCCA GGTTGATCCG GCCAAGAGAC 
CGACGGCGGC GGCGATATTA AAGGTGAGTC GCGCGTCGTG TGTTACCCAA AAAAGATGGA 
AAGAGGCTGA TGGAGAAATG ATTTTTAAAA GCATGAATTC TTCAAGCATA CAGCCCCGTT 
GATATCATTA GCGCCTATGA TCCGATCGTC GCGCAAGAGT TAGACCGGCG ACTCTTGCTC 
GTATCGTCAT ATCATCGTAG ATCCCACCCA TCGACCATCG CCCCTTCCCT TGTCATTTTT 
ATTCTTATTT TTTTTTGGCC GCTACTGCAT TTGCACAAAG GCGGCCTCTG TATATTCAAG 
ATCGAACCAC ATCCGAGCAA AAGGAGAAAC AAAAAGAGGG AGAAAGGAAA AAAAAAGACC 
TTCAACTGTG TATACTTTCA CCACCAATCA CCTTTTTTGC AAAAGCATTT TTTTTTTCAG 
CCTCGACCGA AAAGAAGAAA CGCTCGGCAG TGCAATACGT GTTAATCTCT CTTCTTTTTG 
TCATTCTTTC GTTTCAGCTT TGCGTGGATT TCCCTGTAGA TTTTTATATT TCATTTTGGA 
TTCGGGCTTC TTCCCAACCT CTTTTTTTTT TTTTTTTCCC CGTTTCGTTT TCTTCTTCTT 
CAGAGGTGAG GGGAAGATGT GGAGAGGAGA AATATTGATG ACGGGTTAAA GATTGTTTTA 
GATCAGGGTG TGGAAGAGAA GGGGATATGA GGGAGATTTG TGTGAATATA TATATATATT 
TTAGACTTAT CGGGAAATGC GATATTTGTG CTCAATATA

Protein sequence

MTPSRDSALA SASASRAQSY KGSPSINPRY STGNPASTPP LAANGVPPPR PNRAGTLPLD 
LSLDRDPSPQ PASARSPASQ LPPVLPSPAV SPGVFSPPTL GQPFAAPVGP APGNPYFPSA 
TAAIEKGMED VKMSGPVGVG VPMGVVEPRE KELPREPGSA AMGGRSRSGT GRSSKDKKSM 
FGFVSDLLGK DKPPVISKPY DPVHVTHVGF DFQTGKYTGM PPKWQQVLDD NGITQDEQER 
NPNGVMAVVQ YLKHQDEGED EEEEVWAKMK NAQPPAFPPP SAAPSQPTTP GGGVGSREMS 
REPSNEALGA AGTQVVDFTC PRMAPAPPTK PSLNRMLSER HAPASHRPAE LTTPAPLAAA 
PRVTQAYSSA LSHSPHLPPP HPTSSAPPTA PAPHLDRSYS QRAPVSGTKT KVLDRANTTR 
SPGSSAGIAQ GAGTGVGLTK SQSQSGHKSR DPSREPKDSA SSSGGLSRNQ TTTRQQQGAT 
PRRREKEKKE NEDVIRQLRM ICTPGDPNLV YKNFRKIGQG ASGGVYTAID RQTLPVAIKQ 
MNLEKQPKQD LIINEILVMR ESAHPNIVNF KDSYLWQGDL WVVMEYMEGG SLTDVVTAHC 
MSEAQIASVS REVCEGLRHL HSKGVIHRDI KSDNILLSLN GDVKLTDFGF CARIADPTTT 
KRTTMVGTPY WMAPEVVLRK EYGPNVDIWS LGILAIEMLE GEPPYLTENP VRALYLIATN 
GTPKIKDWDK LSTVFRDYFK VTLQVDPAKR PTAAAILKHE FFKHTAPLIS LAPMIRSSRK 
S