Gene CNH03790 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNH03790
Symbol
ID	3259231
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006693
Strand	-
Start bp	26252
End bp	27677
Gene Length	1426 bp
Protein Length	324 aa
Translation table
GC content	51%
IMG OID	638258105
Product	expressed protein
Protein accession	XP_572579
Protein GI	58270846
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00355884
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATATAT ATACGGCCGA CACCGGTCTG CGATCCTTCC TGTCTGCACC TCTTATTGCT 
TTCTCACAAC ATCACTCCAA CCAGCCAATA AACACAACAA CTACTCTGAC GCCTGCCATC 
ATGACTAGGA CTGAGGTGAG TTTTGGCCGC TCCACCGCCC GAGCTGGTGA CGTCTCCATC 
TCAATACCGC AGTGGAGCTG CATGCCAAGT TTGGACCAGG CTAACAACTG TCCTTCCGCT 
TCGTCTCCAA TCCTACCAAT CACTGTTTGT CTGCCTGTCC TCTATGCGCT GTGGACCGCT 
GCCCTCCTAC GGCCTCACGT AAATGTGCCT TCACCATGGT ATCTTCATCT GGAATGTCTT 
TTACCACCGT GCTGCGCCCT TATTGTATGT CCCCGTGACC GTCTCCTGTC TAACCGGACT 
ACTCCACTCC GCGCCTATCT TTTCTTCCCA TCTTGCTTTT ACCCTTGTTT CGTCTACGAT 
CTATTCCCCA CCATTCCTTC TCGCTCCACC TATCCCATCT TTCCATGTCA CCCCACTACG 
CACTGACCCA ACAGCGCAAC CAATACCCCG CTGCCGTCCT CAAGGACCGT CATTCCCGCA 
CTGGTCTCGA CAAGACCCAG TGGAACCACA AGAACGGCGA TGGCGCCCAT AACTGGGGAT 
CTACCGCCCG TAAAGGCGAT GACGAAGCTT CCGGCCGTCT TGACGGTGAG GCCGAGGCTG 
AAGCCGCTCT AGACGAACTC CCGTCTTCCG ACGTTTTTGA CCTCGATGAA GAGATCAATG 
ATCCTGTCGG TGCGATGCCT GTCACCGACT CTGGCAATGA CTTTAAGCCG ATGGACCTTG 
GCAAAAGAGG GAGTATCCAG GGCCAGAGTA ATATTGCTAC CAGCCCCACC GATAGTATGA 
GCAGCCTTGA CTCTGGCGAC AGGCCTGGGA TGGGGAGGAG GATGAGTGCG GTGAGTGATG 
AAGAGAGAGA GAAGATGAGG CTCTATAGGG AGGGTGTCCT CCACAAGAAG CAGGGTTGGT 
TTTCATATCC ATCTCCGCTT TTACTTATGC TGACTTGTCC TTAATTGCAG GCGTCGACTT 
GGCCCACATC GCTAGKTCCT CGCACGGTAT CGCCATKTCG CCTCCCACCA ACAGCTACCT 
CGGCCCTKTC AGCCCTTCCA ACMCCAGGTA TGGTTTCAAT TTTGTAAGTG TTCAACTTTA 
GCACCTCTTT ACTCTTATTA ATACAATATA GAACAAGTAA AATGTTGTAT CATTATATAT 
GTCGAGCCGG TACTCGACCC CACCAATGTG CATTTAGTCT TTTGATGTTG TGTCCCCGCG 
CTCAGAAAAT GTTGATTAGC CTTTATATCA GAAACCCTCA CGTTGTAGGA TAGTCAGTCG 
CAGCAATGCC GGAGCGTTTG TAGTAAATGT GACCAGGAAA GATTTA

Protein sequence

MYIYTADTGL RSFLSAPLIA FSQHHSNQPI NTTTTLTPAI MTRTEVSFGR STARAGDVSI 
SIPQWSCMPS LDQANNCPSA SSPILPITVC LPVLYALWTA ALLRPHVNVP SPWYLHLECL 
LPPCCALIRN QYPAAVLKDR HSRTGLDKTQ WNHKNGDGAH NWGSTARKGD DEASGRLDGE 
AEAEAALDEL PSSDVFDLDE EINDPVGAMP VTDSGNDFKP MDLGKRGSIQ GQSNIATSPT 
DSMSSLDSGD RPGMGRRMSA VSDEEREKMR LYREGVLHKK QGVDLAHIAX SSHGIAXSPP 
TNSYLGPXSP SNXRYGFNFV SVQL