Gene CNK02920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNK02920
Symbol
ID	3254567
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006680
Strand	-
Start bp	857511
End bp	859161
Gene Length	1651 bp
Protein Length	362 aa
Translation table
GC content	47%
IMG OID	638253783
Product	hypothetical protein
Protein accession	XP_567887
Protein GI	58260954
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCGTCA ACCCATTTTG GGCTATGGTC CTCAGCAGAT TCTTGCAGGG AGCTTCAAGT 
ACTGTTGTGT GGTCTGGTGA GTCCATGATC CACCGAAATG AACATTGTTA ACTGATGTAT 
CTAATGTATT CAGTCGGATT CGCTTTAATG TAAGCGTACA TGGCCAAGGA AATTTTAAGG 
CTCTGGCTGA CCTGAATGCA GATGTGAAAA TGTGGATGAG GAGCATATTG GCCGTCAAGT 
CGGGTTTGCC ATGGCAGGAG TGTCCATCGG CACAACCGTT GTACGTGTTC TCAATTAATA 
TGCATGCTTG AAAAGCCATA TACACGAGCT AACACGTCAA CCCACCGTAG GCTCCTCCCA 
TTGGCGGTGT ACTTTACTCC AAACTAGGCT GGCATGCTCC CTTCATCTTT TGCATCATCA 
TCTGTTTCAT CGATCTGATT ATGCGCCTCT TCGTCCTTGA GCGTACCGAC CTCCGCAAAT 
GGGAAGAAAG GCGCCTCAAT CTTGCCCCTG GAAGTCTTCA ACCCAAAGTA GTAAATGGTG 
AAGTCATCAT GCCGGCCCAG GCGGAAACTT CACCTTTTAT CCATTTGACG ACAGCAGAGA 
AGGCAAGGCT GTCGGGAGTG GAGTTATCTC CTTGGCAGGT GCTTGTGGCA TTGGCTAGTT 
CGCCAAGGGG CATGACTTCG TTCATACAGA TGTTTGCGTA CGGGACGATC ATCGGTGCTT 
TAGAGCCTAC GTAAGTGGTT CATGGTTATC AAACGATGAA GATTGGATAG CTAATATATG 
AATCAGGTTG ACACTTCATG TACAAAGCCT CTGGGGGAAA GACTCCGACT TTGTTGGCCT 
CATTTACTGT ACGTCTCCTC CCCTTGTTGA TCCCCTGTAT CCGTGCTCAT TCGTAACCAT 
CAGTGGCCGC TGCTGCTCCA ACATTCTTCT GCGGCCCAAT TGTCGGTGCT CTCGCCGACA 
AATATGGCGC TGAATGGCTC ATGCTGCCGG CTATGGTACT CACACTTCCA TGGCTACCTC 
TTTTGCTCCT GAAAAAGAGT TTGAGTGCAT TTATTGTCTT CTTCGCCTTC TCCGGTATGT 
ATTCGCCTTT GCTAATTGTA ATATGGTAAC CCATATGTTG ACCTCAAAAT TACTGACTTT 
CATTGGGTCA AATGGTAGAT ATCTTCCCCA ATTGTGCGAT GGCGCCGACA GGCCTGGAGG 
TGACGATGGT TGCGCGAAAC ATTGACGGTG TCAGTGAAAT TCGTAGGTTG TTCGGCCATG 
TATCGCATCT GGTCAGGTAA TTTAATTGAT GTGTTCCATA GATCAATTCG CTGCTATGAA 
CATCGCTTTC GGTAAGTTTC GATCCCCTAT TCAACCAAAA ATGGCTACTA AACAATCTTA 
ACTTGCATCT CTTTCCCATC CACCTTTATT AGCTATATCT AGCGCTATTG GAACCATAGT 
CGGCGGCCAG ATGTACGATC ACGTACCCAA CGGATGGGCA GCTACGATCT GGTTCTGCTT 
CGGTATGGCG GTGGTCGTCA TCCCTTTCCT GTTCTTTTTC GCTGGAAACA GGTCTCTGTA 
CCAGCGGTTA TTGCATATCC GTAAGAAAAA GGGGGAGGAT GTAGAGATGG AGGAGGCCAA 
GGGAATTTCA AAAAGAGACT ATACCGGTTG A

Protein sequence

MLVNPFWAMV LSRFLQGASS TVVWSVGFAL ICENVDEEHI GRQVGFAMAG VSIGTTVAPP 
IGGVLYSKLG WHAPFIFCII ICFIDLIMRL FVLERTDLRK WEERRLNLAP GSLQPKVVNG 
EVIMPAQAET SPFIHLTTAE KARLSGVELS PWQVLVALAS SPRGMTSFIQ MFAYGTIIGA 
LEPTLWGKDS DFVGLIYLAA AAPTFFCGPI VGALADKYGA EWLMLPAMVL TLPWLPLLLL 
KKSLSAFIVF FAFSDIFPNC AMAPTGLEVT MVARNIDGVS EIHQFAAMNI AFVGGQMYDH 
VPNGWAATIW FCFGMAVVVI PFLFFFAGNR SLYQRLLHIR KKKGEDVEME EAKGISKRDY 
TG