Gene CNN01080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNN01080
Symbol
ID	3255540
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006683
Strand	-
Start bp	333659
End bp	335762
Gene Length	2104 bp
Protein Length	603 aa
Translation table
GC content	47%
IMG OID	638254524
Product	hypothetical protein
Protein accession	XP_568745
Protein GI	58262670
COG category	[R] General function prediction only
COG ID	[COG2319] FOG: WD40 repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTTCCA TTAAGCGGCA GTCTTCTTTA AGCTCCGAAG ATCCTTCGTC AGAACCACCT 
TCGGCACTGC CTCCACGCCT CAAAACCAAG CAAAATGTGC CAGCTTCTTG GTCACCAAAT 
ACGACAGCTT CAAATCGCCG AAAGCTCGGA GGGCTCTTTG CTGATTTGGG TATGCCGACA 
AGCGGCTCCC CCTTGAAAGC AACTCCAACT AGAGTGGAAT CCACTCCCAC TAAATCCGGG 
CAAAAGTCCG GTTGGATGGG CACATTATCG TCTCCTATAA CATCTTTCGC CGACCGACTC 
GCTGTACTTT CGATGGTCGC CAACGGTGAA GCCGATCCAG GGAAGTCTCC TGTCAAACGA 
AAGGCCAAAT CAAAGCAGGT CAAGGATTGC AAGGAGTATT TCACAGACAA TGAGGGTGTC 
ACTTGTGAAA GGAAGCGAGA TATTGAAGAA GGCTTAAAGT TTGAACATTT GCCTGATGAC 
CTGTACGTTC TACGTTTCGA CCCTGTCCTT CTTTTTCTGC TGCTCATGCC TATATTTTCA 
GTATCTTGGA AGTTCTCCTC CACCTACCAC CAACACCACA AGCACTTTCG TCGGTGTCTA 
GTCTATCAAA ACGCTTCTAT AACCTCTCCC GCGCACCTAT CTTATGGGCA CGAATATTCA 
ATGCTGCCGG TTATACATCC CAGTTATCCA AGGAGGTACT GGAGCGAGGT TTAGGAGTAT 
GGGAGGGGCC TAGAGGACAA TGGGACGGAT TAACATGGGT GACGGAAACT CAAGATACTA 
TCGATGAGAT TGAAGAAAAG GTGCCTCCCG AGTACATCCC AATACACTAT CCTACTCTTC 
ATCGTACCGC CTGCACACTT CCTCAACTCA TTCGATCACT ATTACCAGCT CACCGAGCAT 
CATTTTCAAC ACTATCAAGT CATACGGAAA GTGTCTACTG CGTTCAGTCA GTGGGGAACT 
GGCTCATCAC AGGTTCAAGG GATCGAAGCA TCAAAGTATG GAGGTTGCCG CCTGTCAACA 
GTGATGAAGA AGCGAGACTT GTTACCACAA TACCCAATGC GCATAACGGA AGTGTCTTGG 
GTCTCTGCTT TGAACTCGAT GATAAAGAGA GAGGATTACT GGTTACTTCC TCCTCCGATT 
GTACCGCTTC CATCTGGTCT CTGGATTTAT CACCCTACCC TCAAAGAAAA TCAGTAGCAG 
TGACCAAGTT GCAAAACCTT TTGCATCCTC TGGCGGTCCT TGATGTTGCC TTGACATCTT 
CATCCATCGT CACCGCTTCC AAGGATTGTC ATGTCCGTGT CTACTCTCGA GACTCGTTTG 
AGCTTGTCCA CCTACTCACA GGACATCGTG GTCCAGTGAA CTGCGTCACG CCGCGCAAGG 
TCGATTGGAC CAGCCGGGAA AAGGGTGAAC AGAGGGAAGA GGTCGTGTCC GCTAGTGGGG 
ATGGGAGCTG GATAGTGTGG GATATAAAAA ATGGATGCCA GCTGAAAAAG GGTGCTGATG 
TCGGGAGAGG TCTTGCTTGT GTTGCATGGG AGGTTCGTAC GAGCTTTCGT GAAATCCCTT 
GAAAGCGAAT ATTACTAACA CGTGATAGGA TGATTACATT CTTACGGGAG ACAATGAATG 
CCTTGTCAAG TTGTATGACG CCGAGACATG TAAACTTCTC AAAGTATTCC AAGGACATAG 
TAATCTTGTA AGAGCCGTAG CTCTGAGGGT AAGGGATGGG ATGGCGATTA GTGGCAGCTA 
CGACGAAAGT GTCATGGTGA GGTTGGGTCT TTTATCGAAG GTCTCTGGAT GACTGATCAG 
TGATTCTGCT ATGTGGCTCA ACAGATATGG GACTTACATA CCGGTCATCT AATCAAGCGC 
CCAACGCTTG GGCATCACTC CCTCATTTTC GACCTTGAGA TGAGCTGTAA ACGATTGATC 
CTGTGGGTGA AATAATCTAT TGAAAGATTA AGACTTCTGC TTATTACTTA TCTACGACCC 
TGATCATCTT CGTTTAGAGT TGGTCATGGG CATTCTGTGC AAGTCTTGAC TTGGGGCAAA 
GGCCTGCCTT ATGTAGATTT CTTTGTCTGA GGAGGCTCAT AAATATATGT TATACATAGA 
TATT

Protein sequence

MLSIKRQSSL SSEDPSSEPP SALPPRLKTK QNVPASWSPN TTASNRRKLG GLFADLGMPT 
SGSPLKATPT RVESTPTKSG QKSGWMGTLS SPITSFADRL AVLSMVANGE ADPGKSPVKR 
KAKSKQVKDC KEYFTDNEGV TCERKRDIEE GLKFEHLPDD LILEVLLHLP PTPQALSSVS 
SLSKRFYNLS RAPILWARIF NAAGYTSQLS KEVLERGLGV WEGPRGQWDG LTWVTETQDT 
IDEIEEKVPP EYIPIHYPTL HRTACTLPQL IRSLLPAHRA SFSTLSSHTE SVYCVQSVGN 
WLITGSRDRS IKVWRLPPVN SDEEARLVTT IPNAHNGSVL GLCFELDDKE RGLLVTSSSD 
CTASIWSLDL SPYPQRKSVA VTKLQNLLHP LAVLDVALTS SSIVTASKDC HVRVYSRDSF 
ELVHLLTGHR GPVNCVTPRK VDWTSREKGE QREEVVSASG DGSWIVWDIK NGCQLKKGAD 
VGRGLACVAW EDDYILTGDN ECLVKLYDAE TCKLLKVFQG HSNLVRAVAL RVRDGMAISG 
SYDESVMIWD LHTGHLIKRP TLGHHSLIFD LEMSCKRLIL VGHGHSVQVL TWGKGLPYVD 
FFV