Gene CNI03950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNI03950
Symbol
ID	3259743
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006694
Strand	+
Start bp	1061919
End bp	1063205
Gene Length	1287 bp
Protein Length	376 aa
Translation table
GC content	54%
IMG OID	638258890
Product	expressed protein
Protein accession	XP_572949
Protein GI	58271586
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

AAAATATAAA ACATGTCCGA CAACAGGCAA GACGCTCAGC GAGAACTCCA CACCCAGGTG 
GAAACTAACA TCGAGGACAG CTTGGGCGTG CGTCTCTCTC CACGAGCCCA CTCTCACTCA 
TGAATTCACA CTTACCAAAT ACATGCAGTC TGCTCTCGAG TCATCTTTCA ATATCCCTCC 
TCCTGCTCCC AAGCCCAAGG TTCCCGTCCC TTCTCAGGAA AAGGAATCCG CTCCTGCAGC 
CACGGCCTCT GCACCTGTCC CTGGTCTTGA CGAGTGGCCC CAAACTTTGC AAGGCTACCT 
CGACGAATGG CAGGCCGAAT CCGCCACTGC TCGTGCCAAA GCTGAAGCTA CTCGTAAGAG 
GTTTGAAGAA GAGCGAGCTG CCGAAGCCAA AGCTCTTGAA GACGCCAAAA AGGCGGAGAA 
AACGAATAAG GAGGAAGAGG AGAAGAGGAA GAGGGATGCG GAGAGGTTGA GGCAGGAGTT 
GGAAGGAGAG GAGGATGAGG TACAGGGCGG AAAGGGTCAC GGACATGGAG ACAAGAGCAG 
GGTCAAGGAA GCTTGGGAAC TTGTTGCCAA GAAGGAAGGG CAGAGCAAGG ACACTCCTGT 
GGTTGAGACT GATGTCCGGG GCGTTACTGG CGAAGACGTG TTCGCCGGCC AGGCTGGTGA 
GAAGAAGGAG GTCAAGGCTG TGAGTACATT TTGTTTCACT GGCAGTATAG CTCTAACTAG 
TATTTAAGCC CGCATACGAC CCCACTACTT CCACCGACCC TATCCCTCCT ATTTTCCAAG 
ACCCCAAGCC CGTCGCTCCA GCTCCTGCGC CTACAGAATC GGCTACTCTG TCCCGGCACT 
CTGCCACCTC TCAAGCGTGG GAAGAAATCT CTGGCCAGTC TTCCGGCAGT GGAGAGCAAG 
TTTCTCCTCC CCGATCCTCT GGCTCCGACG ACATTGTCCA AGTCCCTTCT AACCCGGAAA 
AGGCTCCCGA AGCCCCCCGT CCTCCTACGC AACCCCCCTC ACTCACCCTT ACTCTCTTCA 
CCAACGCTTC ATCCTTGTCA ATCCCTAGGA TCTTTGCCGT CATCGGTATC AACCTTGTGT 
TGCCTTTCAT CAACGGTGTA ATGCTCGGCT TTGGTGAGAT CTTTGCACGG GAAGTCGTGA 
AGGTCGGCAA GGCTGTCTGG AGGGGTGAGA GGAGTTTGTT CAACTGGAAT CGGGGTTCAG 
GTCTTGGAGG CAGAGGAACA ACGGGTGTCG GATTGAGTGG CGCTGGCTTC TAGAGTATTT 
TGCGGATTTT TGACATGCAT CTACAAC

Protein sequence

MSDNRQDAQR ELHTQVETNI EDSLGSALES SFNIPPPAPK PKVPVPSQEK ESAPAATASA 
PVPGLDEWPQ TLQGYLDEWQ AESATARAKA EATRKRFEEE RAAEAKALED AKKAEKTNKE 
EEEKRKRDAE RLRQELEGEE DEVQGGKGHG HGDKSRVKEA WELVAKKEGQ SKDTPVVETD 
VRGVTGEDVF AGQAGEKKEV KAPAYDPTTS TDPIPPIFQD PKPVAPAPAP TESATLSRHS 
ATSQAWEEIS GQSSGSGEQV SPPRSSGSDD IVQVPSNPEK APEAPRPPTQ PPSLTLTLFT 
NASSLSIPRI FAVIGINLVL PFINGVMLGF GEIFAREVVK VGKAVWRGER SLFNWNRGSG 
LGGRGTTGVG LSGAGF