Gene CNE04870 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNE04870
Symbol
ID	3257576
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006687
Strand	-
Start bp	1357390
End bp	1359473
Gene Length	2084 bp
Protein Length	603 aa
Translation table
GC content	51%
IMG OID	638257070
Product	proline dehydrogenase, putative
Protein accession	XP_571179
Protein GI	58268046
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGCAA TCCGACCGAT CATGAGACCT TTTCGAATGA CAACTCCTTT TCGACAATCT 
TCTAGCTTCC GCCAGCTAAG GATTACCTGG GCTCCTTCCT TTGGCGCTGG AAGCAGCCGT 
TGCCTCACTA TCGGCCTTTC TCCTTCCTCT GGTTCTGGGT CCAGCTTTCG CCGCCGACTC 
CTTTATCCCC TTGCTATCCT CCCTGTTGGC TTGCTCTTAC TCCCTGTCCT CTCTGCCGAC 
TCTGAGCCAG ATGCCATTCC TGTGCCCACT TCTCTCTCCA CTTCTACGAC CTCCGAGCTT 
CTCCGGACTT GGTTCATCTA CGCCATCATC TCTATGCCTG GCGTTGTTGA CTACTCTCCT 
GCCGTTCTTA ACTTCTTTAT CAACTCTTCT TTACGCGGCC CCACTGAATG GTTCGTCCGA 
CACACCTTTT TTGGCCAATT CGTCGCTGGT GAGACCGTAG AGGGATGTAT GCCTACTTTG 
AAGGCTTTCA GGGAGAGGAA CGTTGGTGCC ATGTTAAACT ACTCTGCCGA AGTAGACGAG 
TCGCAGTTGA CCGAGACTGC TCCTTCCAAG GAGGAAAGGA ACAGGAAGGA GAGAGAAAAG 
AAGTTTGAGA CTATCATCAC TGCTTTGGAG GCTGCTGGAG AATATGAAAG AAGCTTGCCC 
GTTGACCAGA GAGGTGTTAC TGGTTTCGCT CTAAAGATCG TGCGTTCGTT CCTTGGCAAA 
ATCGAAGAAA TATGTACTAA TATAAATCCT CTAGACTGGC CTTATTGACC CCAACATCCT 
TGAAAGAGCT TCGTACACCC TTCTCCGATT ACGTCCTCTT GCCAAGTCCA ATTCTCCCAC 
AGCCCCCAAC ACTCATCTTT TCGTCCCCTA CCCTGGTACT CCCGAAACCC TGGACCGGCA 
AGTCGTTGCC CGCACTCCCG AGCTTAAGCT AGGTGATGGC AAGGAGCTCC TTGCTTTGAA 
GGGCAAGTGG GATGACATGG GTGTTTTGGA AAAGGATCCT GGATTGCAAG AGGGTGACCT 
TGAGGAGCTT AGACAGTTGT GGTACAAGTT GCAGAAGATT GGTCACAAGG CTAAGGAGAA 
CGAGTGAGTT GATTGAACCC AGGCCATCAT ATTTGTAATG CTGACAGATC TCAGCATCAT 
TCTCTATGTT GATGCCGAGT ACACTTGGTA CCAGCCAGCT TTGGACGCAT ACACCCTTCT 
TCTTTCTCAA GAGTTCAATC GACCTCCCAC TTCCAAAGAG GAGATCTGGA CTGGTCCTCT 
GATTTAGTGA GTTCTTCTTT CGAGTGTCTC CCTTTCATCC TTAACTAACC CATTGCAGCG 
GTACTTATCA GACCTACCTC TGCCGTCAAC CCACACACCT TATTCACGCC ATACAACACG 
CCGAAGTCAA CGGCTACGCC CTCGGTGTCA AGCTCGTCCG TGGTGCCTAC TTTGAGCAAG 
AACGCAAGAA GTGGTCCGAC GAGGGCCGTG TCGGTGCCGC TCCCATCTGG CCCAACAAAT 
CTGCTACTGA CGTCGCTTAC AATGGCTCTA TCTCCACCAT CATGACCACT CTCGCCTCCC 
AACTTAAGTC TCCCCACCCC GAGCTCGCTT TGAGCGTTGC GTTCGGTACC CACAACCCTG 
AGTCTTGTGA TCTCGTCTGC GAGAACTTGC TCAGGAACGG CCTTGCCAAG GAAGTAGGGG 
AAGCGAAGAT GTTGAGGTTG AGAGAGGACG TGCGGGGTAA GGTTAGGATT GCACAGTTGC 
TGGGTATGAA GGACGACCTC ACAGATCGTA TGGCCAGAAA GTTCGTCAAT GATGGCAAGC 
CCGTTGCTCT CAAATACATG GCATACGGCA AGCTTTCAGA GGTTATGCCT TACCTTGGTA 
GGCGGGCGAT TGAGAACAAG AGTTTGATGA GCGGTGATCA CGGTGCAGCA GCAGAAATGA 
GGCGAGTGGC GGCCGAGTTA AAGAGAAGAT TTTTTGGTGG CTCAGTATAA GGCGCTCAAG 
TGGAGATGTA AGGTGTAACA GAGTCCCGTC AGTAGTATCC GTCATCTTTT GGGGGTTTCT 
TGTGTTTAGA TATAGACTGC CATGTACTGT ACAATGCATA ATTA

Protein sequence

MSAIRPIMRP FRMTTPFRQS SSFRQLRITW APSFGAGSSR CLTIGLSPSS GSGSSFRRRL 
LYPLAILPVG LLLLPVLSAD SEPDAIPVPT SLSTSTTSEL LRTWFIYAII SMPGVVDYSP 
AVLNFFINSS LRGPTEWFVR HTFFGQFVAG ETVEGCMPTL KAFRERNVGA MLNYSAEVDE 
SQLTETAPSK EERNRKEREK KFETIITALE AAGEYERSLP VDQRGVTGFA LKITGLIDPN 
ILERASYTLL RLRPLAKSNS PTAPNTHLFV PYPGTPETLD RQVVARTPEL KLGDGKELLA 
LKGKWDDMGV LEKDPGLQEG DLEELRQLWY KLQKIGHKAK ENDIILYVDA EYTWYQPALD 
AYTLLLSQEF NRPPTSKEEI WTGPLIYGTY QTYLCRQPTH LIHAIQHAEV NGYALGVKLV 
RGAYFEQERK KWSDEGRVGA APIWPNKSAT DVAYNGSIST IMTTLASQLK SPHPELALSV 
AFGTHNPESC DLVCENLLRN GLAKEVGEAK MLRLREDVRG KVRIAQLLGM KDDLTDRMAR 
KFVNDGKPVA LKYMAYGKLS EVMPYLGRRA IENKSLMSGD HGAAAEMRRV AAELKRRFFG 
GSV