Gene CNF03830 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNF03830
Symbol
ID	3258219
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006691
Strand	+
Start bp	1121293
End bp	1123461
Gene Length	2169 bp
Protein Length	541 aa
Translation table
GC content	46%
IMG OID	638257502
Product	epsilon DNA polymerase, putative
Protein accession	XP_571676
Protein GI	58269040
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

AGCAGGCATA GCAGAGCGAG ATGGTGAATC AAATGCGTTC AGCGATCGTT AAGGTAAGAT 
TTTTCTCTAT CCTCTTCGGA GAAAGGACTG ATTTTGCATG ATTAGGTCTT TTCGACCAAG 
CACTCCTTGA CATTGCCTGC TCCAGCCCTA CATTATATCG AAGAAGTTCT TATAGAGGTT 
GGTAGATTCG AGACCTTTTA GCCGGCCTAT GGATCCAGCT AATGGCTCGG TCAGAATGAA 
ATTCCCGAGG ACGAATGGAT GGTTGGTCTC GAATTTTGGG CGAAAGAGTA TTTGAAAGCT 
GAAGGTACGT TCGTTTGCTG CAGAATACAG CATTACATAC TCACGTATTT CATTTTAGAT 
TCATCATCAT TGGTGTCATT GCAAGCTTTA AAAAAGGCCT ACGAAAATCT TCAGCTTGGC 
GTGAGCTCTA TACTGCCTGT ACCATCGTAA AATCGCAGAA AGCTGATATG CCCACAGACA 
ACAGAAGACA CACAAGTAGC AGACCCTTCT GAAGTGAATG TTGAATCACA CTTCTCTGTC 
GTGGACTCTT TTGATATGCC TGCCATGAGA TATGATCCTG TACGGTCAGG TTTTGTTCAG 
TGAGTCACAT GATTCCAAGT TTAAAACCAA GACTGATCAA GATGTAGATC CAAGGCTCAA 
CCGTCTGTCG CTGGTCAGGC CAGTTCAAGA TCGGCTTTCC TTCGTGAACG TTGGGCCATT 
ATCAAAGAGG TCAGTTTTTC TGTGTTCATC CTCAAGCTGT CCTTACGTTG TGCAGATCAT 
CCTTCGTAAC GAAAATTTCA CACCCCCTGC TATCGGTGGT CACGATCGTG CCAACTATCT 
CAAATTGACG TCAATCCGCA ACCTCTTAGG CCGTGCTGGT CAGCTTTTTC TGTTATTCGG 
AATGCTCGCG CGTAATGAAG AGGGCAAGTT GTGCCTTGAA GATGGAGAAA GTCGAGTTGT 
TCTGGATATG GAAGATGCTG TTCCCGGTGA GGGGCTGTTC ACTGAGGGGT GTATGGTCTT 
GATAGAAGGA GAGTACACAG TGGAGGAAAC GGTTCGCGTG TTGGCTATGG GACACCCTCC 
GAGTGAAAGA AGAAATATCG CGAGGTCCTT ACATGGGCAC GTGGACTTCT TGGGAGGTGG 
TGCTGTATCT CTGAAAGAAG AGGTGCGGTA ATTTGCGCTG CATTTTGGAA AAAGAACTAA 
CTTGAAGTAG CAAAAGTACA ACCCCACAGT GCTTGCCAAC ACTCAGATAT CTTTTGTTAT 
TCTGTCTGAT GTCTGGCTCG ATCATCCGAG AACTATGCCT GCCCTGCGCC AGATGTTTGA 
AGGATATGCC AACACTGCCG AGTACCGACC GATGGTGTTT GTACTTTGCG GTAACTTCTG 
TCAAGGCGGA TGGGAGGGCC AGGAAGGGCT CAAAAGATAT AGCCGAGGGT TTAATTCTCT 
TGCAGAGCTT CTTCAATCCA TTCCCCTGCT TCATTCCTCA CATTTTGTCT TTGTTCCCGG 
CCCTTCAGAC CCTTGGTCCA GCACTACCCT TCCTCGTCCC TCTCTTCCTT CAGCATTCAC 
CACGCGTTTA TCAAACCGTA TACCGAACGC AAGATTTGTC AGCAACCCAT GTCGGCTGAA 
GTACTTTGGA ATGGAGATTG TGATCTGTAG AGAGGATTTG ATGGGGAAGA TGATGCGAAA 
CTTAGTTGTG GTCAAAGAGG GTGAGGAGAT GAACATGAAG CGATATGTGA GTATTCATAA 
CGTCCTTGTC TAGTCATTAC TAATATACAG ATAGCTCGTT CAAACTATTT TGGACCAAGC 
ACATCTCTCG CCTCTTCCTA TTTCTGTCCG CCCCACTCTC TGGGAATACG ATCACGCTTT 
GCGCCTGTAC CCCATGCCTT CTGCCGTGGT CTTGGCAGAT AAGTACGAAC GATATGAGCT 
CACTTACGAA GGGTGCCACG TTTTTAACCC GGGAAAGTTT GTTGGCGGAA TCGGAGAAGA 
TGGGTGGGAG TTTGAATGGA GTATGTATTA TCCCGCTACA GGCAGAAGTG AGCGAAGGTG 
AGTGTTATTG TCTAGTAGCT TTTAACCCCG AAACTGAATG TGCAACAGTG TCTTGACCAT 
GGAATAATTG TTTCAACGTT GATTTGGGCC GCTGTTGTAC TATAAGATCG TCATGCATTA 
TAACATATT

Protein sequence

MVNQMRSAIV KVFSTKHSLT LPAPALHYIE EVLIENEIPE DEWMVGLEFW AKEYLKAEDS 
SSLVSLQALK KAYENLQLGT TEDTQVADPS EVNVESHFSV VDSFDMPAMR YDPVRSGFVQ 
SKAQPSVAGQ ASSRSAFLRE RWAIIKEIIL RNENFTPPAI GGHDRANYLK LTSIRNLLGR 
AGQLFLLFGM LARNEEGKLC LEDGESRVVL DMEDAVPGEG LFTEGCMVLI EGEYTVEETV 
RVLAMGHPPS ERRNIARSLH GHVDFLGGGA VSLKEEQKYN PTVLANTQIS FVILSDVWLD 
HPRTMPALRQ MFEGYANTAE YRPMVFVLCG NFCQGGWEGQ EGLKRYSRGF NSLAELLQSI 
PLLHSSHFVF VPGPSDPWSS TTLPRPSLPS AFTTRLSNRI PNARFVSNPC RLKYFGMEIV 
ICREDLMGKM MRNLVVVKEG EEMNMKRYLV QTILDQAHLS PLPISVRPTL WEYDHALRLY 
PMPSAVVLAD KYERYELTYE GCHVFNPGKF VGGIGEDGWE FEWSMYYPAT GRSERSVLTM 
E