Gene CNF04810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNF04810
Symbol
ID	3258146
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006691
Strand	-
Start bp	1398957
End bp	1400768
Gene Length	1812 bp
Protein Length	448 aa
Translation table
GC content	47%
IMG OID	638257599
Product	transporter, putative
Protein accession	XP_571631
Protein GI	58268950
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TCTGTACTTA GTCCAAAAAA GCTGCTCTAA CTTACCCAAT CAATGGCCTC CGAGATTGAG 
CTGTCCCGCC TTCCGAGCCA GCGAAATGAA TCCGCCACTG AACAACAACT CGACTATGAT 
CGGGAACACG AAGTCGATGA ATCAGCTACA CATTACGCGC TGCCCCCGGT AGATGGAGGT 
CGAAGGGCAT GGGCATTCCT TGCTGGTGCT ACCGTTGTGG AGATGCTTGT ATGGGGATTC 
CCTTACTCGA TTGGTATCTT GCACGCGTAC TGGAGTAATA TCTTATTCAA AGGCTACGGC 
GAGTCAGCAA TCACCCTGGC TTCCACTCTG CAGACCGGTT TACTCTACGT GAGTTGTGCC 
ATCTTTGGGC CGTAAGTTTT CATTTCTCGA AAACCCCGAT TGATGACTGA CCATCCTTAA 
GAGTGTTTAC CAGATGGCCG AGATGGGAGA AAACTCTCCA ATATTTTGCT CTTTTCGCTT 
CTGCATTGTC GATGATTGGG AGTGCTTTCG CAACGAAGGT GTGCTTAACC AAACATATTG 
AACTCAAGTG CTGATTATCA TCTAGCCCTG GCACCTTGTC ATAACTAACG GCTGCATCTA 
TCCATTCGCA GGAGCCCTCT ATCTTCCGTG TTGTACTATT CTTTTCGAAT GGTTTGTCGC 
TAAGCGGTTC GTTTTTCTTG TTCATAACCA TACTCATGCG TTCGCTAATC AAGACACAGA 
GGAATTGCTA CTGGTCTTAT GTATGCAGGT ACTGGTATCG GTGGCGTAGC ATACCCGTAT 
ATTATGAGTG GCCTCTTGAA CGGCGTAGGC TACAAAGCTG CTCTAGTATC GATGGGTATA 
GGCTACGCCA TCCTTGGTTC CATCGCCCTC ATTCCTGTCA ACCGACGAGT CCCCCTTTCT 
CGATACTATT TTACAGAGCC TGGAAGGAGA AAACAATTCA ACTTTTCATT CTTGAAAAGC 
TCAGTCGCTT TGACGGGTTC GTTGATCATC CTTTTCGTCA GCATGGGTAA CTTCATCCCC 
ACTGTCTGGC TGCCATGTAC GTCGGACCAT TATTCGTTTT TGGCAACGAT ACTGACACAT 
ATGTAGCTTA TGCCGACGAC CTGAAACTAC GTCACCTCGA CGGTACCGCC CTCATTGCCA 
TTCTCAACGC CGCCACTATC CCAGGCAATA TCCTCCTTGG CTACTTCTCT GATTTTTCTA 
TCCGCGCTGT TATCGTCGTC TCTTGCGTCG GCAGTGCTTT CGGATGCGCA TTCTTGTGGG 
GTTTCGGGAC GAATGCGGCC ATGCTTGTCG CTTTTGCAAT CGTTTACGGT TTTCTAGGAT 
CAAGCTTCCA GTGTCTATGG TCTAACATGA TTAGTGTCAT TTCTAGTGAG TTACTGTACG 
GACCGATGCC CATTCCTTTC GCTAACGCAG GATTATAGAG GACGACCCCA TTGCTCCATC 
TCTAATTTTC TCAATCTTTG CCTTAATGAG GGCTATCGGT AACATCACAT CTGGTGCGTA 
TATAGCGCAA TTTTCACAAT GAGTGTACTT ATACTATTGT AGGGCCCGTT TCTGGCGCGC 
TCATGAAGCA TGACTCGTTC CCTGGCGCTG TTGGAGCTTA TGGTTTCCAC AACTATGTGA 
GTATTCCCCC TTCATCAGGT GCCCATATGC TGACGGCGAT GTTGGAAGGG CGCCTTGTTG 
GTGTATACAT CTGTAACAAT CTTTACCGGG GGAGTTACCG GTATCCTGTT CAAAGACCGT 
TAGGGAAAAT CTACATCTCC GAAAAGATTT TAAACTCTAT AGAAATCGAA CGCTGTAGCA 
ATAGTATGAT AC

Protein sequence

MASEIELSRL PSQRNESATE QQLDYDREHE VDESATHYAL PPVDGGRRAW AFLAGATVVE 
MLVWGFPYSI GILHAYWSNI LFKGYGESAI TLASTLQTGL LYVSCAIFGP VFTRWPRWEK 
TLQYFALFAS ALSMIGSAFA TKPWHLVITN GCIYPFAGAL YLPCCTILFE WFVAKRGIAT 
GLMYAGTGIG GVAYPYIMSG LLNGVGYKAA LVSMGIGYAI LGSIALIPVN RRVPLSRYYF 
TEPGRRKQFN FSFLKSSVAL TGSLIILFVS MGNFIPTVWL PSYADDLKLR HLDGTALIAI 
LNAATIPGNI LLGYFSDFSI RAVIVVSCVG SAFGCAFLWG FGTNAAMLVA FAIVYGFLGS 
SFQCLWSNMI SVISKDDPIA PSLIFSIFAL MRAIGNITSG PVSGALMKHD SFPGAVGAYG 
FHNYGALLVY TSVTIFTGGV TGILFKDR