Gene CNG00230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNG00230
Symbol
ID	3258832
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006692
Strand	-
Start bp	54780
End bp	56250
Gene Length	1471 bp
Protein Length	374 aa
Translation table
GC content	49%
IMG OID	638257637
Product	U5 snRNP-specific 40 kDa protein, putative
Protein accession	XP_571754
Protein GI	58269196
COG category	[R] General function prediction only
COG ID	[COG2319] FOG: WD40 repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.718611
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTTGCCCGAG GAAATATTTA TTATTTCTTA TCACAAACTG CCCGCCATGT CCGTCAGGAA 
GTCGCCACCG ACAGCAGGCC CAGGAATGGC CCTCTCGAAA CGTGCTCGAG TGGAGGATGA 
GGCCGACGAA AACACCATGG TCATGACCGT TGCTTCTTCA GGAGAAGGAC AGCGGAAAAA 
CGCTTTGATA AGGAGTGTCA AGAGGACGAG TAGTCTTGAA GCGCCTATCG TGTCATTGTC 
GGCTGCTCAT GGTGTATGTC TTCAAATATT GACGACGTAC GCGGATGAAA CTGATAAAAG 
CAGGGCGAGA TTACGGCTTG TGTGTTTGAC CCTTCAGGAC AGACTCTTGC GGCTAGTTCG 
GTGGACCGCA GTATTTGTAA GTTAAGATAT TACTTGGATG CCTATCTCTT ACAATCCTGT 
AGCTTTGTGG AAGTCCTATC CCCCACACGA CAACTACGGT ATCCTTCCAA ACGTCCATAA 
GACCGCTATC CTTGATATCG CCTATTCCCT CGACTCTGAA ACTATCTACT CTGTCAGTCT 
ATCATGCGCT TTCACAAATC ATCACTGACA ACATACTAGG GTGCTGCAGA CGGCACTCTC 
ATATCTACTG ACTTACGTAC CGGTGAACGC ATTTCCCGCT ACTTTGCACA CTATGGCCCC 
TTAAACTCTA TATCCGTCAC CATCTCTGGC GGTCGAGAGC TCGTGTTGAC AGGTGGTGAT 
GATGGGATTG CTCGTGTCTG GGATTTTGCA TTGGATGGGA AAGACCCTGT GGCAGAGTTT 
GATGATGAGC GAGATTGTCC AGTGACAGCT GTGGAATGGA GTTCAGACGG GAACCAGTGT 
TTCGTTGGTG GAGTTGACAA CACCATCAAG GTAGGTTATA CCCCCGCGAG TTATTTCAGT 
CCTGAAGCTG ACAGATTGTA GGTATGGGAC CTTCGAACGA ACAAAGTTCT CTACACGCTT 
CACGGCCACA CCGATACCAT TGCTTCCCTT TCTCTCTCGC CTAACGGCCA TTACCTCGCC 
TCCTATGCTC TCGATTCTGC TCTCATCATC TACGACGTCC GACCCTTTTC TTCCGACCCC 
ATGCGCGTGT ACAGATCTCT CACCGGCGCA CCAGCAGGTT TTGAGCAAAC CCTCATACGA 
TGTGCGTGGA CAAGACATGA TGGCGGACAA AGAATAGCGG CAGGAGGTGG AGATAGGACC 
GTTACTGTTT GGGAAGTTGA GACGGGCAAG GTGCTGTACA AGCTTCCGGG GCATAAGGGA 
ACTGTGACTG GCGTGGATTT CCATCCTAGG TATGTCACTA TTAATTCTGT TTCCGATATC 
GAGAGGCAAA GTCGCTGATT GGTATGCATT CAGAGAACCA ATCATCTTGA CAGGATCAAA 
AGATACAAAC ATGTTACTTG GCGAGCTGGA TGCTCAAGAC TTCTCATAGA CGGGCGGCAG 
TACGAAAAAA GTATTAGTGC GATAAGCAAT G

Protein sequence

MSVRKSPPTA GPGMALSKRA RVEDEADENT MVMTVASSGE GQRKNALIRS VKRTSSLEAP 
IVSLSAAHGG EITACVFDPS GQTLAASSVD RSISLWKSYP PHDNYGILPN VHKTAILDIA 
YSLDSETIYS GAADGTLIST DLRTGERISR YFAHYGPLNS ISVTISGGRE LVLTGGDDGI 
ARVWDFALDG KDPVAEFDDE RDCPVTAVEW SSDGNQCFVG GVDNTIKVWD LRTNKVLYTL 
HGHTDTIASL SLSPNGHYLA SYALDSALII YDVRPFSSDP MRVYRSLTGA PAGFEQTLIR 
CAWTRHDGGQ RIAAGGGDRT VTVWEVETGK VLYKLPGHKG TVTGVDFHPR EPIILTGSKD 
TNMLLGELDA QDFS