Gene CNC01950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNC01950
Symbol
ID	3256196
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006685
Strand	-
Start bp	539342
End bp	540486
Gene Length	1145 bp
Protein Length	233 aa
Translation table
GC content	46%
IMG OID	638255415
Product	conserved hypothetical protein
Protein accession	XP_569446
Protein GI	58264580
COG category	[R] General function prediction only
COG ID	[COG0693] Putative intracellular protease/amidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CAATAATAAT AGTAGTTGTA TATCAATAGT ATTGTTCACT GCCTGACTAA CCGTACTTCA 
AAAACCTCAG TTCGTAAATT CAGCCATGTC ACAGCCTAGC AAAGCCGTAC TTTTCGTCTT 
CACCTCGGCC GAGAAGCTTC TCAACGGTGC AGTACGTGTG ACCTCCCACC CTTTACCTTA 
TTTATCTTTA GTACCTGCCA ATGACTGATA TTGTTTTGCA GCCGACAGGA TGGTATCTTC 
CTGAAGCCGC CCACCCGTAC TACGTCCTTT CCCCCCATTA CCGTATTGAA GCCATCTCCA 
CTAAGGGTGG CCCCGTCCCT GTCGACGAAA CCTCTGTCAA GAATTTCCAG GACGAAGATT 
CGCAGAAGTT TTTGAAAGAT CCTGAAGCTC AAAATTTGGT CAAAAACACC AAAAAGGTAG 
AAGACGTCAA GGCCGCGGAT TATGAAGCCA TGTTTGTCAT CGGCGGAGTG AGTGCTGATT 
CCAAAAGGGA AGAGCGTAAT TCCAGACCGG AAGAGCGTGC TTGAATGGAA GTGTTTAGGA 
GCTGATCATG AAGCATCTCG TAGCATGGGC CTTTGATTGA TTTGGCGAAG AGTGAAAAGT 
TTGCCAAGCT TGTAGAGGAC TTCTACGTTG CAAAAAAGGT AAGACAATTG AACATTCTCA 
TGGGTGTCAT TCGGCTAAGG AATAGGGCTA GCCGGTGTCT GCAGTGTGTC ATGGTCCTGG 
CGCTTTCATC CTTGCTACCA ACCCGGCGAC TAGGAGGTCT ATTTTCGCTG GCGCACGTGT 
CACAGGCTTT TCTAACAGTG AAGAAGCACA AACTCCTTAC AATGATTTTG TCAATATTCT 
CCCTTTCAGT TTGGAAGACA AAATCAAGGA ACTTGGTGGG CAGTATGAGA AGGCCGACCA 
AGACTGGGGT GTCAAAGTCA TTTGGGATCA GGGAGTTTTA ACTGGTAGGT CACCATTGCG 
CATTACCCAA GCACCATCAC ATCACGCTCT CCACTGAACA TATATCCAGG CCAAAACCCT 
GCTTCTGCTG GACCTCTCGC CGTAAAGTTG AAGGAAATTT TGGAAGCCTG ATATGGCATA 
CAATTAAGCT AAGGACGGCA TATGTAAAGA ATACAAGGAG ATGTGACTTA TCATGATGTG 
CAAAC

Protein sequence

MSQPSKAVLF VFTSAEKLLN GAPTGWYLPE AAHPYYVLSP HYRIEAISTK GGPVPVDETS 
VKNFQDEDSQ KFLKDPEAQN LVKNTKKVED VKAADYEAMF VIGGHGPLID LAKSEKFAKL 
VEDFYVAKKP VSAVCHGPGA FILATNPATR RSIFAGARVT GFSNSEEAQT PYNDFVNILP 
FSLEDKIKEL GGQYEKADQD WGVKVIWDQG VLTGQNPASA GPLAVKLKEI LEA