Gene CNM00020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNM00020
Symbol
ID	3255289
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006682
Strand	-
Start bp	2815
End bp	4183
Gene Length	1369 bp
Protein Length	201 aa
Translation table
GC content	45%
IMG OID	638254162
Product	expressed protein
Protein accession	XP_568392
Protein GI	58261964
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTGCTGATGT AGTGCGGCAA CCTGGCTTTC CATTTACTCT CATCTTCGCC AGTTACCACG 
ACCTCTTTTT TCGGATACCT ACATCCGGGA GAAGGAAAGA TGCGAGGAAA ACGTGCGGGA 
TTATGAGTGG GACTCGGATG TAAGGACTTT CAACTTGCAT GCTTTTCCAC CATCCGCTGA 
CGTTGTACAG CAGGTCGGCT TCTCATCTGT TCCCCTCCGC TCGCCCATGT TGTATATGAT 
ATCATGTCGT CCTTCTCATA TTTGCGATCA GGAGGAGTTG AAGTGATGAT GCCGGATCAG 
AGGCTGGTGG AGCAGGAACG AAAGAGAAGG GAAGTGCGCT CAGAGGGACC GCCGCTCAAC 
ATTCGTGAAC CAATGTCCGA TGAGGAGAAA GCGATGAGTG GTCCAAATTA TCAAGCAATT 
GCAGGGCAAT ACATGGGATC TAAGACGTAA GTGCTTTCGA ACTAAACGCT TTTCTCGCAT 
CTGCTGATGC TGTATACAAG CCTAATTGCG ATATACTATC TTTGTCTTGC GAACTGCTCC 
AGTCGTATAA TGTTTCAACG CCGCTTACAC TTCCTTGAGA TTCTATCCTT ATACCTAGCT 
TCAATCTTTC CATCAGGCGA TTAATTCTCA TTGACGATGC CCGGAAATGA GAGTGGCTCT 
GAGGATGACT TTCTGAGTAT TATGTTCCGT GAGTTGGGAG CGACCTTCGC TTCCCTGTGT 
CTTTTTATTG TGGCTGATGT CTCTCCCAAC AAACTGCGTG TCCTCTTTCA CAATGATTAG 
CTTCCAGCTC GTCTCGCAAT GACTTGTTCA ATCATAAACT GTTCAGTTTA TAGACGGCTA 
GATATGTTCT CAAAACGTCT CACATCTGCC CACCCCTTTC GACATTATCC CTCACGATTT 
CACATCAAAG GTCAGCCACT GTCCACCTTT CTCCTCAGTT ACCTGGATCT TAAACATTCG 
CCTATGGTCG TTTCTACCAC TCGTCTAGAT CATCCGGCGA GGATTTATTT GGGTTCTACT 
CTACTAAGGA GAAACGATGA ATCAGTTTTG CGAACGACAC AACATGACAA GCGCCATCAT 
TAACCATGCA AGCATAAAAA CATTGTGTCT ATTGGGTTCT GCTGATGTAA GAAGGGCCGC 
TTTCCGGCTG ATGGATGACC TATTGAAACA CATCATCGAT AATTCCAGTC TGGTTGCCTC 
AGTTGGAATG AGTTCAAAGT GGGCAGGATG ATTTTTAAGG AATAGGCTGC CAGATCGCAT 
CTGCATGCAT TGGTATTGAA TATACGGCTG GGAATAGGAT TGGGTTGAAA CTGGATAAGT 
AATTAGTTAT CTTAAATATT AGTCAATCGA TGAAATCGAT GATGAATTT

Protein sequence

MSSFSYLRSG GVEVMMPDQR LVEQERKRRE VRSEGPPLNI REPMSDEEKA MSGPNYQAIA 
GQYMGSKTLI AIYYLCLANC SSRIIRLDMF SKRLTSAHPF RHYPSRFHIK GQPLSTFLLS 
YLDLKHSPMV VSTTRETMNQ FCERHNMTSA IINHASIKTL CLLGSADVRR AAFRLMDDLL 
KHIIDNSSLV ASVGMSSKWA G