Gene CNK02660 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNK02660
Symbol
ID	3254453
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006680
Strand	-
Start bp	770147
End bp	772380
Gene Length	2234 bp
Protein Length	532 aa
Translation table
GC content	47%
IMG OID	638253758
Product	hypothetical protein
Protein accession	XP_567865
Protein GI	58260910
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.11556
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

AAGCCACTCA ATTCTTAAGC ACCACTACTC CACTCGCATA TAACAAGCCC AATCACTCAC 
TCTCTCCCCT TTACACATAT TATTCTAGCC AATATGGCCG CAGTTGACGA CAAAGTCAGC 
ATCGAGCATG TCGAGTCGGG AGATCACTAC ACCAAACACC ATGTCACCCA GGAGGAGGTC 
AAGCATGGTG ACAATGCCCT GAAATACATT GGTGATGAAC GAGTAGAAGT CACACAAGAG 
GATGTGAGTA ACGAATTTTC CCTCTAGTGG TTCTGAGTTT CTTGTTTTGA AACAAAGAAA 
AAAAAGTTTA CGGGATTTTC CGAACCTTAA AATGCGCAGG TGCTGACTAC TTTTTGTTGC 
AGGATGCGCG AATTAGGAGG AAAACCGACA AGTACATTTT GTCTTTACTA GCATGGGTGT 
ACTTCTTGCA AATCCTAGAC AAGACTGTAA GCGCTTTTTG CTCGAGACAT GTATTATTAT 
TATTTCTAAT TTTGCCACCT ATAGGTATTG GGTTATGCCA ACACTTTCGG TCTCTCCGAG 
GACACAAATC TCGTTAACAA CCAATACTCT CTCCTTGGTT CCATCAATGC CATTGTCCAG 
TTGGCTTGGC AGCCATTCTC GTCCTACTTA ATCGTCAAAG TTCCTGCCAG ATATCTCATG 
CCTGCCATGG TTTTCGGCTG GGGTGCCGCT CAAGCATGCA TGGCCGCGGC TCACAAGTAA 
GTAGACTTTC CTTTTACCTA ATGATCCGTG ACGCGCAGTT ATCTGTGTAT CCTGATAATA 
AAGCATGTGC TGATAACGGG ACTTAGTTTT GGCGGTTTAA TGGCGTCGCG AGCCATTTTG 
GGTCTGTTTG AAGCTGGTTG TCTTCCGCTC TTTTCTCTCC TTACCTCTCA GTGGTACCGT 
CGATCTGAGC AACCTGTCCG AGTGGCCGTC TGGTACTCGA CTAATGGTCT TGCCACTATC 
GTGGCCGCTC TTCTTTCCTT CGGTCTCAGC CACGTCGACT CCCCTCACAT CAAGTCCTGG 
CAACTCATTT TCATTGTCTG TGGGATTATC ACCTGTGTTA CAGCTCCAAT CGTCTACATG 
TTCGTCGATG CCGATGTCGC TTCGGCTCGT TTCCTTACGG AAGAAGACAA GGCCAAAGGC 
ATTGAGCGAC TCCGTGCGAA CCAAACAGGT ACCGGTTCCA ACGAGTTCAA AGTATCTCAC 
GTCTGGGAAC TCTTCTGCGA TCCCAAGTCC TATCTTTTCT TGGCGATTTC TCTTCTCCTC 
AATGTTGGCG CCTCAGTGAC TAACATCTTT GGGCCGACGC TCATCAAGGG CTTTGGATTC 
AACAGCAGGA TCACCTCTCT GCTCAATATG CCATTCGGAT TCCTTCAGTT CGTCGCGATT 
CTGGCTGGGT GTTACTGCGC GTACAAGTTC AAGCTCAAGT CAGCTGTCCT CGCCGTTTTT 
ATCATCCCTG TTATCATTGG TCTCGCTCTC TTGTATGTCG AGAATGCCGC AGCTGTTTTG 
AAGCAAGCTC CTGCTCTTGT CGGATATTAT CTCCTTGCCT TCCTTTTCGG CGCCAATCCA 
ATCATCGTAT CTTGGATCGT TGCCAACACT GGTGGTCAAA CAAAAAAGGC TCTCCTTATG 
AGTGTATACA ACGCCGGATC TTCCGCTGGT AATATCATTG GTCCTTTGTG AGTCGGCGCA 
TTCAGCGTGT TTCATGGATT ACTCGAAAGC TGACTGTTTG GCACAGGCTC TTCCAAGACA 
AGGACAAGCC TCACTATCTT CCTGGTATCA AAGCCACTCT CGGTATCTTC TGTGCCTTGA 
TGGCGTGTGT CGGTATCACT GCGGCTCTTC TTTTCGCTCT TAACAAACAG AGGCAGAGAC 
AACGTGTTGC TGTCGGCAAA CCTCAATACA TCAAGGATAC TTCTATGAGC AACAAGTACG 
AAGCCTATGG TGCTGATGAC GTGGACGGAA GGCTCGGTCA GAATGGTATG TCTCCGTTTT 
TTTATGTTTT AACCTGCTGT GCATCGCTAA CATTACTTAT ACAGCCTTGC TTGACTTGAC 
CGACTTTAAA AACGACGAGT TCGTGTATGT GTATTAGGAG TCAAAGCTTG TTGCGCCTGG 
GTGGAATCCA CCGGCTATTG GCATAATAAG GTGGTATATG ATCATGTAGG GGTCGTTTAG 
AGCATTTTTC GATCATCAAA CATATCTAGT GTAATCAGTA TATTGATACG TGTACAACTA 
CAATGCAAGA ATCA

Protein sequence

MAAVDDKVSI EHVESGDHYT KHHVTQEEVK HGDNALKYIG DERVEVTQED DARIRRKTDK 
YILSLLAWVY FLQILDKTVL GYANTFGLSE DTNLVNNQYS LLGSINAIVQ LAWQPFSSYL 
IVKVPARYLM PAMVFGWGAA QACMAAAHNF GGLMASRAIL GLFEAGCLPL FSLLTSQWYR 
RSEQPVRVAV WYSTNGLATI VAALLSFGLS HVDSPHIKSW QLIFIVCGII TCVTAPIVYM 
FVDADVASAR FLTEEDKAKG IERLRANQTG TGSNEFKVSH VWELFCDPKS YLFLAISLLL 
NVGASVTNIF GPTLIKGFGF NSRITSLLNM PFGFLQFVAI LAGCYCAYKF KLKSAVLAVF 
IIPVIIGLAL LYVENAAAVL KQAPALVGYY LLAFLFGANP IIVSWIVANT GGQTKKALLM 
SVYNAGSSAG NIIGPLLFQD KDKPHYLPGI KATLGIFCAL MACVGITAAL LFALNKQRQR 
QRVAVGKPQY IKDTSMSNKY EAYGADDVDG RLGQNALLDL TDFKNDEFVY VY