Gene CNA03880 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNA03880
Symbol
ID	3253412
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006670
Strand	+
Start bp	1041990
End bp	1043345
Gene Length	1356 bp
Protein Length	140 aa
Translation table
GC content	45%
IMG OID	638252707
Product	conserved hypothetical protein
Protein accession	XP_566729
Protein GI	58258633
COG category	[S] Function unknown
COG ID	[COG0432] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00149] secondary thiamine-phosphate synthase enzyme

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTCCAA CCTCTCAGGC GCTCAATATG CTAATCTTTG TTGAAATTCA CAAGTTCGTT 
GCCCCCTAAT AGGAAGGGGA TGCATCTGGT TTGCTCGTTT TACATTCGAT TTTAGTTACT 
TTGCTGATGT TTCTGATGAC CAGGTAACTA ATGAAGTTAT TCAACAGTGT CGGGAAGGCT 
TGAAAAACGT AGACATCGGC ATATTCACTC TTCATTGCTT GCATACCTCT GCTGGCTTGA 
CTGTAAGCTT GTTTTCTGGG TGCTTTGTGG CTGCTATTCC TGCGGGATCA CTTGCTTATG 
TGTGTCTACA TGCAGCTGAA CGAGAATTGT GACCGGTGAG TTGAGACTTC CTGATCGGAT 
GATATGATGG AACTTGTTCA TTTACAATTA TTACAATGAC CCACAGAACG GTTCGGACAG 
GTGAGTTTGC GTGTATCCAA ACTCAACTGT AGCAGGACTC CTTTCAATCT GACAATAATT 
AACAGACATG GATATGGCTC TTGACACTAT CGTGCCCGAA TCTTTACCGT GGGAACATAC 
AGATGAGGGA CCAGAGTACG TCTTGACTCT TAACTTTCTT ACTGGAGTGA GCGAAGCTTA 
CCTACGTCAT TCTACTCAGT GATTCTGTAT CCCATTTGAA GACATCATTG ATTGGAAATT 
CTATCACTGT CCCCATCTCG AAAGGAAAGC TGGTTTTGGG TACGTGGCAA GGTATTTACC 
TTGCGGAATT CAGGCATAAT GGCGCAGGAT GGGGTGGGCA AGGACAGGGG CGCAAAGTTG 
TTGCTACAAT TCTGTAGGTC GGCCCGCATT AGAAGATGAC CCCATTGACC CGTGCGAAGT 
CCATAACACA ATACTTGCCA GCGAATGAAC GATGCAACTG AGACTGAGGG CTGAGTTGAA 
TATTTCATTT CGTGAACTGC ACTACGTGCC ATTTCCTAGC CTCCCAATTC TCACAGACGT 
CGTCCGTACA TTCTTTCTTA TCTTGCGTTC CCGATTGGTC ATCGGCTCCT TCCAGAGCAA 
CTCGTTTTTT GACTTCGACC CTCATACTAG CACCTAACAT GTCGACGATG ATCAAACTCG 
CGTTCAGACC ATACACCATG GTGGCAGCGT AGAAGAAATT CGCATTGCCT GTGCCGGTGA 
GTAGCCAAAG AGAATGTAAC AAAGGAAGAA GAATAGACGT GTATAGATGG ACGGTGAGGG 
AGAACAGAGG ATGGCGTAAA TCTACACAAT CAGATGAGTT GCGATACTTG GTTTCAGCAC 
TTTATTTGAC TTACTGGCAA GTATATCAGG GAAGCATCCA ATTAGTCCAG CACAAAGACC 
CATATCTCCC AGAGCAGGAA AGCTCTTCCA TGTGAC

Protein sequence

MSPTSQALNM LIFVTNEVIQ QCREGLKNVD IGIFTLHCLH TSAGLTLNEN CDRTVRTDMD 
MALDTIVPES LPWEHTDEGP DDSVSHLKTS LIGNSITVPI SKGKLVLGTW QGIYLAEFRH 
NGAGWGGQGQ GRKVVATILP