Gene CNF01620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNF01620
Symbol
ID	3258477
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006691
Strand	+
Start bp	478721
End bp	480649
Gene Length	1929 bp
Protein Length	397 aa
Translation table
GC content	52%
IMG OID	638257287
Product	nucleotide-sugar transporter, putative
Protein accession	XP_571496
Protein GI	58268680
COG category	[G] Carbohydrate transport and metabolism [O] Posttranslational modification, protein turnover, chaperones [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5070] Nucleotide-sugar transporter
TIGRFAM ID	[TIGR00803] UDP-galactose transporter

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CAGGAATAAC CATCCCGGCA CCATGTCCAA ACCTTTCGTG CCCACACCCA ACATCTCTCG 
CCCAGCCACT CCCTCCTCCC TCGACTACGG CAAGGACGAG GCCTCTTCCA CCCTCCTGAG 
GGACATGGGC GAGCGGGGAG ACAGAGAGAG GAAAGACAGG GAAGAGAGGG ACAAGAAGGA 
GGCTATGCCG TCGGGACAGG ATCAGGGTGA GTCTGGCCTC TGACTGACTG CGCATGTATG 
GAGGGAGAGA CCAAGCTGGA CACGGCGACT GGACTAGATG TATTGGCGGA TGACATGGGA 
ACGCGCCCTG CCATGCGCTA TATCCCGTCT CGCTGCCACG TATGGCGTGG GCTGAGGATA 
GACAAGTGCT GACCACGCGT CCTAGTCCTC CCCATCCTCT CGTACTGTGC TGCCAGTATC 
ATGATGACCG TCGTCAACAA GGTGAGCCGT TCTGTCTGTT CCGGGTGCTG CGGACTGCGC 
GACGCGTTTC AACGCTGATC ATTACATCCG CAGTACGTCG TGTCCGGCGC GAACTTCACC 
ATGACCTTTT TGCTGTTGGC TATCCAATCG AGTGTCTGTG TTTTGGCCGT CACTACCGTG 
AAGAAGCTGG GTTTCATCTC TTGTTAGTCG ATCGGCATGC TACATGTAAA CAAGTCGGGC 
TGATAGGCTG GGTTCTATCT AGTCCGTGAC TTTGACAAGA ATGACGCCAA GGCCTGGTGG 
CCCATCTCTA CATTGTTGGT GGCTGTCATC TACACTGGTT CAAAGGCTTT GGTAAGTTTA 
GTGGGGTTTT GAGTTGCAAT CGATGCTAAC AAAGATGTAG CAATTCTTGT CTATCCCCGT 
CTACACGTGA GCCGGCCGAC CATCTTGAAA ATGTGGACTG GACTGATCTC GTTTGTAGTA 
TCTTCAAGAA CTTGACCATT ATCCTCATTG TCAGTATCGA CACCATGGTT CAAGCCTTAA 
AAGCTAATCT CTTTTATAGG CCTACGGAGA AGTGTTTATG TTCAACGGTG CCGTCAGTGG 
TCTCACACTC TGTTCATTTG CTCTCATGGT GAGTACATTG AGTAAGGTCT AGGCATGTCG 
CTGATAATAT CCCAGGTTGG CTCTTCCATC ATCGCCGCCT GGTCCGATAT CACTTCTGTG 
TGGAACAAGG AGCCTGAGCT TGACCCTATT ACCGGTCTCG AGATTACTGT TGGCCCCGTA 
TCTACGATTG GTGGCCTTAA TGCTGGTTAC ATTTGGATGG CGCTCAACTG TTTCGTCTCT 
GCTGCCTACG TACGTACACT GTTTTGGAAT GATGGGCATA GCTGACAATA TATTTGACAA 
TCCAACAGGT TTTGTTCATG CGAAAGCGAA TCAAGGTCAC TGGCTTCAAG GACTGGGACT 
CTATGTATTA CAACAACCTT CTCTCCATCC CCATCCTTGT CGTCTTCTCT CTTGTCATCG 
AAGACTGGGG TTCTGAATCT CTTGCCCTCA ACTTCCCTGC TTCCAACCGT GTGCTCCTTC 
TCTCCGCCAT GGCCTTTTCC GGCGCCGCTG CCGTCTTCAT TTCATACTCT ACCGCCTGGT 
GTGTTCGTAT CACTGGTTCC ACAACATACA GTATGGTCGG AGCTTTGAAC AAGTTGCCTG 
TCGCCGCGAG CGGTATCTTG TTCTTTGGTG ACCCCGCCAA CTTTGGTAAC ATCTCGGCCA 
TCGCTGTTGG TGGTGTCGCT GGTGTGGTGT ACGCTGTGGC CAAGACTAAC CAGGCAAAGG 
TAGAGAAGGC TAGGCAAGCA AGGGCCGCGG GTGGTAGGCC ATGAGGTGCT TTTGAAAAAC 
AGGGGACCAG AAGTACGTTT GGTGATGATT CACGGTGTAT ACACATTGTG CAAAACGGGA 
TTATTTAGAG AGAGCTCTAC AGAGAGCGCT TGTTGCTTTG ACCATGCATA GATAACAATC 
CGTTTGATA

Protein sequence

MSKPFVPTPN ISRPATPSSL DYGKDEASST LLRDMGERGD RERKDREERD KKEAMPSGQD 
QVLPILSYCA ASIMMTVVNK YVVSGANFTM TFLLLAIQSS VCVLAVTTVK KLGFISFRDF 
DKNDAKAWWP ISTLLVAVIY TGSKALQFLS IPVYTIFKNL TIILIAYGEV FMFNGAVSGL 
TLCSFALMVG SSIIAAWSDI TSVWNKEPEL DPITGLEITV GPVSTIGGLN AGYIWMALNC 
FVSAAYVLFM RKRIKVTGFK DWDSMYYNNL LSIPILVVFS LVIEDWGSES LALNFPASNR 
VLLLSAMAFS GAAAVFISYS TAWCVRITGS TTYSMVGALN KLPVAASGIL FFGDPANFGN 
ISAIAVGGVA GVVYAVAKTN QAKVEKARQA RAAGGRP