Gene CNA04010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNA04010
Symbol
ID	3253395
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006670
Strand	+
Start bp	1072904
End bp	1074700
Gene Length	1797 bp
Protein Length	477 aa
Translation table
GC content	49%
IMG OID	638252721
Product	hypothetical protein
Protein accession	XP_566747
Protein GI	58258669
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CACCTAGTAA TCATTCCAAC ATGTCGTTCG GAGGGTAAGT GACCGCACAA CCTCGACCAC 
ATCATTTGGA TGCTTACGCA GCCCATAATC ACAGATTCAA GTTTGGAAAC TCGTCAACAA 
CCGCCCCGGC AACCGGCAGT GCCCCAACAA CTTCAAGCCC ATTTTCGTTT GGTAACACAA 
GCACATCGAA CGCGCAACCA GCTGCTGGTG CGAGCAACAC TGGGGGTGGG ATGTTTGGTG 
GATTTGGGCA GAATCAGCAG CAGCAACCGC AGCAGCCTGC CGGAGGTGGA TCATCCTTGT 
TCGGGAGCTT TGGCGCTAAG CCTGCAGCTC CTGCCGCAGG AACGACTGGG ACCGGAGGAG 
GACTATTTGG AGGTGCCAGC GGTCAGCAGC AACAACCACC TTCTGGTGGT GGTGGACTTT 
TTGGGTCAAC TACTCAACCT CAACAGCAGG CTCAGCAATC TGGCAGTGGG TTGTTTGGAT 
CGACAACTCA ACCTCAACAG CAGCAACAAC AAACGGGTGG TCTCTTCGGG TCTACGATGC 
AGCCTGCCCA ACAATCTAGT GGATTGTTCG GCTCTACAGT TCAGAAGCCA GCTGGTAGCG 
GTCTGTTTGG ATCAACCACT CAGCCCACTC AGCAATCTAC GGGCATCGGT CTGTTTGGGT 
CTACAGCTCA AACCGCCCAA CAGCCAGCCA GTACCGGTCT CTTTGGATCC ACAACTCAAC 
AGCAGCAGCC CTCTACCTCT TTGTTCGGCC AGTCGACAGC CCAACTAGGT GGTTCCAGTC 
TTTTTGGACA GACTACTCAG CCTCCACAGA ATCAGCAACA AGAACTGAAG ACTTCTGCCA 
ATCCCGGTGC TAACACAGGC GCCGACAAAA CTACCAAGTT CTCGGACCTT CCAGAAGCGG 
CCCAAAAGTA TATTGAGCAG CTTGAGTATG CCCTTTTGCA ACGATTCCCC TTGCCGTACT 
AACTTAATAT AGTACCGCGA TAAAAAACCA AAAGTCCATC GCATCCACCT TGCAGACGGA 
ACCCCTCGGA CGAGCTATCT GGCAAACAAG TCTTGATGTC AAGTCAGCCA CAGAAGTAAG 
TATTTTTTTT TTTGGTCCTC TTTCAGCTCC TTCTCACACT TTTAATAGGA ATACAGCTCC 
ATCTCGCACA CTTTAAAATC CCTAAAGAAC AGCATATCTC AACTCCGCGA TAAAATGATT 
GACCAATCAA GGGATGTTGA GCGAATCAAG GAGATCTGGG ACATATATAC ATCAGGTGAA 
GGCAGAATGG GACAAATCAG GCTAGGAGCT TACAAGGAAT TCCCTCACGA GTGAGTATCA 
TGCATATCAA ACATATAGAG TGCTGATTTG TCTCAGATTC TTCTCCAAGG TTGCTAATTC 
GATGGAAGAA AGAGTGACGA GATACAAAAA GACTATCACA GTACGTCGAT GTTCGCGCGC 
ACCGAGTCTT AACTGATGAT GTCTCTCATC ACAGCAATTG AACCGTGTGG TTGCGTCCCT 
TTCTTCTGAC TCTCAAACAT CTTCACCGCA AGTCATCGCA CAGACCATCA ACAATCATCA 
GCAAGCTATT CTTGCTCTCG CTGCTCAGTT GGATCAGTTG CAAGTGAGAA TGAATGGATT 
GAAAGCGGAG TTCACGTGAG TTTTTATAAT TTTGGTGCAG TGCATTGCTG ACAGAATTAA 
AGTGCGGACT GGAGAGATAA AACGGGATCA GTGAGGGATC CGTTCGAGAT GGCTAGAGAA 
GAGAGGAACG TCAAGGTGTA AATTGGAGAT AGTAATGATT TAGCATGCAT TATGATC

Protein sequence

MSFGGFKFGN SSTTAPATGS APTTSSPFSF GNTSTSNAQP AAGASNTGGG MFGGFGQNQQ 
QQPQQPAGGG SSLFGSFGAK PAAPAAGTTG TGGGLFGGAS GQQQQPPSGG GGLFGSTTQP 
QQQAQQSGSG LFGSTTQPQQ QQQQTGGLFG STMQPAQQSS GLFGSTVQKP AGSGLFGSTT 
QPTQQSTGIG LFGSTAQTAQ QPASTGLFGS TTQQQQPSTS LFGQSTAQLG GSSLFGQTTQ 
PPQNQQQELK TSANPGANTG ADKTTKFSDL PEAAQKYIEQ LDTAIKNQKS IASTLQTEPL 
GRAIWQTSLD VKSATEEYSS ISHTLKSLKN SISQLRDKMI DQSRDVERIK EIWDIYTSGE 
GRMGQIRLGA YKEFPHEFFS KVANSMEERV TRYKKTITQL NRVVASLSSD SQTSSPQVIA 
QTINNHQQAI LALAAQLDQL QVRMNGLKAE FTADWRDKTG SVRDPFEMAR EERNVKV