Gene CNH01200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNH01200
Symbol
ID	3259153
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006693
Strand	+
Start bp	836480
End bp	837890
Gene Length	1411 bp
Protein Length	368 aa
Translation table
GC content	48%
IMG OID	638258363
Product	conserved hypothetical protein
Protein accession	XP_572310
Protein GI	58270308
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATATCAT CAACAGCAGC GACAGTCTTT GGACTCGTTT TGGCGAGCGT GGGAGTTCAA 
GCCTCCACCC CTCTTGTCAG GACGTACCAA GGAGACTCTT TCTTTGACCG ATGGGTGAGC 
TGATTCTCCA ACATGGGCTT TACTTGCTGG GCTTGTTGAT TGACATGCTT GGAATCAGAC 
TTACTACGGC AACTACGACA ATACCACCAA CGGTGACGCT ATCGTGAGTT TTCAATCTCA 
GCTCCCTTGT CATGCCTGTG CGAAGCGGTA CATTTGCTAA GATCAATTGA CCGCAGTTTG 
CCAATAAATC CGTAGCCACT TCCACTCCCG AGCTCACATA TGTGACGTCT GATGGCAGCG 
CCATCATCCG AGTGGACAAC TCTTCTACCG TTCAGTACAA CTACAAGCGT GATACTGTCA 
AGATCACCTC GACTGACAGT TACCCCGTTG GATCTATATG GGTTCTCGAT GCCGTCCACT 
TACCATATGG ATGCAGTGTC TGGCCTGCAT TCTGGAGTTA TGGTGCTGGT GCGACATGGC 
CTGAGGAAGG TGAAATCGAT GTCATTGAGG GTGTGAACAT GGGTTTCTCT AATCAAATGG 
CTTTGCACAC CGAGGACGGG TAAATAATAA TGCGGTTATT TTCTGTTACT ACCTGTGGCT 
TACTCTCCAT TGTTAGATGT TCCTTGGGAT CTTCAGGCTC TTCATTCACT GGTATTGTCA 
ACGACACTTC ATGCTACTAC GAAGACAACG ACAATTCCGG CTGTGGCGTT ACCGAAACCA 
ACAATGCTTC CTATGGAGCC GCCTTTGCTG CCGCCGGAGG TGGTGTCTTC GTCACCGAGC 
TAGCCGAGTC TGGGATTTCC ATTTGGTTCT TTAGCCGATC CGATATTCCT GATGCTATAA 
GCAATGCCGA CGACGAGATC GACACTAGTA CTTTGGGTAC TCCCAGCGCT TATTGGGGTA 
CTGACACCTG TGACATTACC AAATTCTTTG GTGACCAATC TCTTGTCTTC GATATTACTC 
TTGTAAGTGT ATATCCAGCC ATCATTTTTT TGGACCAAAA TTAATCCATA TGTTAGTGCG 
GTGACTGGGC TGGTCAGTCT AGCATCCTTG CTTCTACAGG ATGCTCTGCT TTGTCTGGTT 
CCGACACTTG CTACACTACC TATGTGCTCG ACGCTAGCAA CTACGACACT GCATACGTAA 
GTGTTCGCCT TTTCTTTCGT ACATTCTATC CTCTAATATA CATCTTTTGC AGTTTGAGAT 
AAACAGCTTG AAGGTCTACT CGAACGGAAG CTCCTCCAAT TCCAGCTCTG ACTCTAGCAG 
CAGCTCTGCC CCGTCTACTC ACCGCTTCAG TGCCTTGGGA TGGTTGTTGG CTGGTGTTAT 
GGGCGTGTCT GCCTTGGTGG GGATGATGTA G

Protein sequence

MISSTAATVF GLVLASVGVQ ASTPLVRTYQ GDSFFDRWTY YGNYDNTTNG DAIFANKSVA 
TSTPELTYVT SDGSAIIRVD NSSTVQYNYK RDTVKITSTD SYPVGSIWVL DAVHLPYGCS 
VWPAFWSYGA GATWPEEGEI DVIEGVNMGF SNQMALHTED GCSLGSSGSS FTGIVNDTSC 
YYEDNDNSGC GVTETNNASY GAAFAAAGGG VFVTELAESG ISIWFFSRSD IPDAISNADD 
EIDTSTLGTP SAYWGTDTCD ITKFFGDQSL VFDITLCGDW AGQSSILAST GCSALSGSDT 
CYTTYVLDAS NYDTAYFEIN SLKVYSNGSS SNSSSDSSSS SAPSTHRFSA LGWLLAGVMG 
VSALVGMM