Gene CNB04620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNB04620
Symbol
ID	3256030
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006684
Strand	+
Start bp	1322086
End bp	1323335
Gene Length	1250 bp
Protein Length	309 aa
Translation table
GC content	47%
IMG OID	638255105
Product	hypothetical protein
Protein accession	XP_568952
Protein GI	58263084
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0702] Predicted nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	0.599307
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAGCA ACGCAGCCAA GAAAATTGTT GTGTTCACTG CCACCGGCAG TCAGGGTAGT 
TCTGTAGCTC GATACCTCTC CGAGGCCGGT TACAAGATTG TTGCTCTTAC TAGGGATACT 
GAGAGTAAGA GCGCCAAAGG TGAGACAGAT CCTTTCATGT CTTCTGAACA AGATCCAAGC 
TGACCTATGA TGGTGATTTT TGTTAGCTCT CAAGGCTAAA GGCTATGAAG TTGCGAGAGC 
TGACAACACC GATCCTGAGT CCTACAAGCC TGCCCTCCAA GGAGCTTATG GTGCTTTTGT 
CAACACTGAT TGTGAGTCTT CAGTTATTCC CTGTTTATGA GATACTCATA ACACTACTTC 
TAGTCTGGTC GATTTTTCCC ACTAAGAACT TTGACCCCGA ACTCACCCAG GCGGAAGAGT 
TTAAACAAGG CACAGCCGCC TTGCAGGCTT GCAAAGAGGC GGGATTGAAA CAGATCGTCT 
ACTCAACTTT GGATGATGGA ACGGGATGCG TGCACTGGCA GTCCAAAGCA GAAGGTAAGA 
TTGATCACAA TTATTATAAG GATACATGCT TATAGTCAAT TCCTAATTAG TCTCCAAATG 
GGCAAAGAAC AACGACATCC CCATTACCAA CCTTGTACTC ACGTTCTACT ACGAGAACAT 
CGTCAAAATG AACGCATGTG CCGGTGATGA CCAGGGCCCC AATACCTTTA CCCTTAACTT 
GCCTCTCCCA GAGGATTCCT TAGTCCCTGG GTTCCCCGTT GCTCAGACTG GATTGTGGGT 
CAAGACAGCG TTCGATGACC CTAAGAACTG GATCGGTTAG TGCTTTCAGT TTGGGATGAG 
TTCCTGCATG GCTTACGTGG CCCTAGGCAA AGACATATAT GCCTGCACTG ATATTATAAC 
AGTCAAGGAG ATGGCGGATC AGCTCTCTGC TGTCAGCGGG AAGACTGTTA AGACCAACGG 
GTTGCCAGTT GAAGTCTTTA AGAGTAAGGA TTTTCAAAAG AAGGTCGGTC AAGAGCTTTG 
GGACAACATG GACCTTTTCT ATCGAAGGTG AGCTCCTCAT ACTCTTATCA TAAGCCAAGA 
TGCTGACAGT CTATGCCTAT AGATTCCTCC AAAGAGATGT CCAGGAGAGT GTGCGTCTGG 
CACCTGGTGC TTGGAGTTTT GAGGCTTGGG CAAAGCAGAA TGATCAGCTC AAGAAGGCTC 
TAGGCTTTTA AATTAGTATT GAGGCATGAA GATGAAAGCC AGCTAGTCAA

Protein sequence

MSSNAAKKIV VFTATGSQGS SVARYLSEAG YKIVALTRDT ESKSAKALKA KGYEVARADN 
TDPESYKPAL QGAYGAFVNT DFWSIFPTKN FDPELTQAEE FKQGTAALQA CKEAGLKQIV 
YSTLDDGTGC VHWQSKAEVS KWAKNNDIPI TNLVLTFYYE NIVKMNACAG DDQGPNTFTL 
NLPLPEDSLV PGFPVAQTGL WVKTAFDDPK NWIGKDIYAC TDIITVKEMA DQLSAVSGKT 
VKTNGLPVEV FKSKDFQKKV GQELWDNMDL FYRRFLQRDV QESVRLAPGA WSFEAWAKQN 
DQLKKALGF