Gene CNE00100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNE00100
Symbol
ID	3257947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006687
Strand	+
Start bp	16399
End bp	18264
Gene Length	1866 bp
Protein Length	621 aa
Translation table
GC content	55%
IMG OID	638256592
Product	retrotransposable element slacs 132 kda protein (orf2), putative
Protein accession	XP_570697
Protein GI	58267082
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.21893
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCCGCA CTTCTCGTCT CATCCCCTTG AAGAAGGACG ATGGCTCTAT CCGACCTATC 
GCTGTTGGTG AACTTATCTA TCGGCTATGT GCGAAAGCTC TCATCATCTC GCATTTCCAA 
CCCGACTTCC TCCTCCCGTT CCAGCTCGGG GTCAAGTCAA TCGGTGGTGT AGAGCCGATC 
GTGAGGCTGA CAGAGAGAGT CTTGGAGGGT TCTGCCGGCG CTGAGTTCTC CTTTTTAGCC 
TCGCTCGATG CTTCTAACGC TTTCAACCGT GTAGATAGGG CCGAGATGGC AGCAGCGGTC 
AAGACCCATG CGCCGACGCT TTGGAGGACA TGCAAATGGG CCTATGGCGA CTCGTCCGAC 
CTTGTGTGTG GTGACAAAAT CCTTCAATCC TCTCAAGGTG TTCGACAGGG TGACCCCTTT 
GGCCCTCTCT TCTTCTCGAT CACCCTCCGA CCAACCTTGA ATGCCCTCAG TCAATCGCTA 
GGTCCGTCTA CGCAAGCACT CGCTTACCTC GATGACATCT ACCTCTTCTC AAACGACTCT 
CAAGTCCTCA GCAAAACTAC CCAATTCCTC GCCGACAAGC AGCACATCAT CAAGCTCAAT 
GAAAAGAAAT GCAAGTTAAT CAGCTTCGAT GAGATCAGGC AGGAGGGCTT CAAGATGCTA 
GGGACGATGG TAGGTGGTAA GGAGAAGCGG GCGGAGTTTC TGGAAGGCAG GATTCGGAAG 
GAAATGGCAA AGGTGGGCAA GCTCAAGGAT CTTCCACATC AACACGCGCT CCTTCTATTA 
CGCTTCTGCA TTCAGCAAAA TCTACGACAC CTGCAGAGAA GCCTACGCTC CGACGACCTT 
GTAGATCTAT GGGAAAGACT GGACACGATG CTGTGGGAGG AGGTGAAAAG GATGAGGATG 
AGGCAGCGAG AGGATACGGT GGAAGAGGAG GCTCTAGGGA GATCGTTGAC GAAGCTACCA 
GCGCGACTGG GCGGACTAGG TCTACTTTCC TTCAAAGATG TAGCCCCCCT TGCTTACCGC 
TCGGCAGCCG AGGCCTCCGA CACTCTCCTC GATAACCTAG GTCTCCTTTC TTCGCCAGAG 
GAACCTCCAA CTCCGATCCC CCAACGAACT CGATGCGCAG AACTCTGGGA ATCGCAACAG 
GAAGCCATCC TACATAATCT CGGCGACACT GAACGCAAGC GACTCACCGA GAATGCCTCC 
AGACTCGGCC GAAGTTGGTT ATCAGTTATC CCTTACCTTC AACCCCTGCG CCTTTCCAAT 
GTCGAGATTG CCTCCGGTCT CCATGACCGC ACCCTGGTCG GCTCCTCGAT CCCTGTCTGT 
CGCTTCTGTG GGTCGGACTC ACCTTTGGGT CACGACGAGC TTTGCCGCGC CCGCAACCCC 
TGGACCCAGC GCCGGCACAA TGCCATCAAC CGCGTCATTT ATCAACACCT CAAACAAATT 
CAAGGTGCCA CGGTTGAGAT TGAGCCCCAC ACGCTGTCTG GGCAAAGGAG AAACGACCTT 
CGGGTCAGAG GTTCCAGCGC TCTGGCCTTC ACTGACTACG ACCTGAAGGT ATACTCCCTC 
GGAGACCGAG ACGCGAGAAG CACCGTCACA CCCTGTGCCC CCAACGGCAA GCTGGCCGAC 
TTCTGCTTGG ACCGGTGCGT GAACTGGCTC GACAAGGTGG GTCAGGTCGT CTCTAAGAAC 
GCTCCGAAGG TCACTGGTGG GGTTTTTAAA CCAATCATCC TTTCCACTGG TGGCTTGATG 
AGCAGGAGCA CAGCAGACGA TTGGAAGGAC TGGAGGGAGG CGATGCCGGT GGGGGGGTTC 
GAGAAGATGG AGAAGAGAAT TGGTGTCGAG CTAGTAAAGG CAAGGGCGAG GACGCTGGTC 
TTGTGA

Protein sequence

MLRTSRLIPL KKDDGSIRPI AVGELIYRLC AKALIISHFQ PDFLLPFQLG VKSIGGVEPI 
VRLTERVLEG SAGAEFSFLA SLDASNAFNR VDRAEMAAAV KTHAPTLWRT CKWAYGDSSD 
LVCGDKILQS SQGVRQGDPF GPLFFSITLR PTLNALSQSL GPSTQALAYL DDIYLFSNDS 
QVLSKTTQFL ADKQHIIKLN EKKCKLISFD EIRQEGFKML GTMVGGKEKR AEFLEGRIRK 
EMAKVGKLKD LPHQHALLLL RFCIQQNLRH LQRSLRSDDL VDLWERLDTM LWEEVKRMRM 
RQREDTVEEE ALGRSLTKLP ARLGGLGLLS FKDVAPLAYR SAAEASDTLL DNLGLLSSPE 
EPPTPIPQRT RCAELWESQQ EAILHNLGDT ERKRLTENAS RLGRSWLSVI PYLQPLRLSN 
VEIASGLHDR TLVGSSIPVC RFCGSDSPLG HDELCRARNP WTQRRHNAIN RVIYQHLKQI 
QGATVEIEPH TLSGQRRNDL RVRGSSALAF TDYDLKVYSL GDRDARSTVT PCAPNGKLAD 
FCLDRCVNWL DKVGQVVSKN APKVTGGVFK PIILSTGGLM SRSTADDWKD WREAMPVGGF 
EKMEKRIGVE LVKARARTLV L