Gene CNC03640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNC03640
Symbol
ID	3256167
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006685
Strand	+
Start bp	1152859
End bp	1154078
Gene Length	1220 bp
Protein Length	316 aa
Translation table
GC content	49%
IMG OID	638255585
Product	expressed protein
Protein accession	XP_569589
Protein GI	58264866
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTTTCT CGCCCCCACA AGAATCCCCG AATCTTCCCT CCCTTGCAGC AGCTTTAGCC 
GACACTAGCG GAGCTGCCCA GGGCATCCAA ATTGCCCCAG AACTCATTGG TGACGGTGGT 
GCACCTCCTG ACCTTCCTCG GCGCGAAGAG CTTCAAGGTC AACAACCATC TGATGGTGTT 
TCACAGGCAT TCGGATCATA CCAAAATTCA TCCACAAGAG ACGATGGATA TCGCGGATGG 
TCAAATGGAC CTAATCCTCC TCCAAGGGCG CAGAATCCAT GGGAAGAAGG ATACCGCGAT 
CATTCCTCCC ATCCCGATCC TACAATCAAT CAGCAATACT CCTATTCTGA GCAGGCTGGA 
CCATCCATCT CCACGGAAAA TATTGAAGAA CCTCAGAAAC CTCCGCGCAA ACGCGCAAGG 
CAGTCCAAGC CTCGCGGGCA CGAAAAAAAT GGTGTCAACA GCGATGGTTT GCCGGAGGAG 
GGCATACTTG ATTTTGCTCA TCCATCAGGG GACTTCAAAC TTGGTCCAGT ATTCGTACAT 
CCGCCTAAAG GAGTTGCTCA AGCGTGTGTT CGATGCCACA AAATCAAGAG AAAGTGTGAC 
AATGCGCGAC CAAGGTGTGC AGGATGCAGC AGGGCCGATG TAGCGTGCGT TTTTGAGCTG 
AACCCCGCCA CCGCTAGGTA AGTCTGGATC TTGCAGTAGG TTTTGTAACT GTTTAACCTT 
TTATGTTCAT TCAGCTATGT CTCGAGCTTG AAGTCAGACA ATGTCACTTT ATCTGCTCAG 
ATGGTCTCCG CCGCTGAACG TATCTCTCAA CTTGAAGCTG TACTGGTCAA CACTGGCCAG 
GAGATCCCTC CACCTCCACA GACTCTCAAG AACATAGATT TTACCGCCAT TGCCGGGGAC 
AAGTTCTCTG CGAAGGATGA TGACGTATCG ACTGAGGATG CAATCAAGAG ACTAGCGGAG 
AGTGCTTTGA CCACAAGCCT CCATAAGAGA AGACGGATGT CGTGGTAATG TTTGAATATG 
TTTGAATCAG GGAAGTATGC TATCTGTGAG TCTTTTTTTT ATAGAAGGCG CTGCATGCCG 
CTGACAAGTG TTGCACTAAA GCACGTCTCG GGTATCCTGG GTTGACATGA TAATTGGGAT 
CAAGCTACAT TATTGACCAG CCGTACTGTA CTCCAAGTTT GTAGTCTTAG CCTCGTCAAT 
TTATATATCG CCTTTCATCA

Protein sequence

MSFSPPQESP NLPSLAAALA DTSGAAQGIQ IAPELIGDGG APPDLPRREE LQGQQPSDGV 
SQAFGSYQNS STRDDGYRGW SNGPNPPPRA QNPWEEGYRD HSSHPDPTIN QQYSYSEQAG 
PSISTENIEE PQKPPRKRAR QSKPRGHEKN GVNSDGLPEE GILDFAHPSG DFKLGPVFVH 
PPKGVAQACV RCHKIKRKCD NARPRCAGCS RADVACVFEL NPATASYVSS LKSDNVTLSA 
QMVSAAERIS QLEAVLVNTG QEIPPPPQTL KNIDFTAIAG DKFSAKDDDV STEDAIKRLA 
ESALTTSLHK RRRMSW