Gene PICST_74461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_74461
Symbol	DPB2
ID	4851553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	2118124
End bp	2120237
Gene Length	2114 bp
Protein Length	680 aa
Translation table
GC content	41%
IMG OID	640393261
Product	DNA-directed DNA polymerase epsilon, subunit B
Protein accession	XP_001387649
Protein GI	126274835
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.293318
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATCTG TCAATACCCT TCCCATTAAG CTACAGCCTT CTAACTTGAG ACCTATAGCG 
TATAGGGTGT TCTCCAAGAA ACATGGTCTT AATATCAAAA CTGATGCACT CAACTTACTC 
ACAGAAGTAA TAAGCTACAA GTTCTCCTTT GACTGGAAGG GGCCAAAATC ACAGCAATTT 
TTAGAGGAGG TAGCGAAAAC ATGGAAATTG GAAGACAGAG GATTGTTTAT AGACGCTCCA 
GGCTTGAAGC AGGTGTTGAA AGAAATCAAT ACAAAGTCGG GATCTTTGGA CTCCAGTTCA 
GTTTATGGGA GTAGAAGCTC GAGTACCACC TCGGAACCTG AAAGAGCCGG AAGAAGTGAT 
ACGTTAGTCG ACTCGGAAGA AGAGCAGAAT ATCAACTGGG AAGACTACTT TAAATTTATA 
AATCCCGACC AGCAACCGCA TTGTGTATTT GACAAACTGA GAAAGCAGTT CAAGGTCCTG 
CCGTCAACTA ACAGTAAAAG CAAGTCTCTA ATTGGAACCT TGCCCAACAA CTTGCAGAAC 
ACTGTTGAAC TATTTAATAA CAGATACCAC ATCATTTATG ATCGGTTGTC GAGAAACGAG 
AACTTCCAGA AGTCGTCATT TTCCAGTATC TCGACAATCA ATAAATCACT TCACAATGGC 
TCAGCCAACG AAATCACCCT AATCAAGAAT GTTCTAGGCA GAGACGGATC CAAATTTATT 
CTTTGTGGTC TTTTGTCGAA AGACGCCAAT GATTCGTGTA TTTTAGAGGA TTCTACAGAT 
TACATTGAAT TAAATTTGAC TCAAACTTAC AAGACCCAGG GGTCATTCTA CTGCCCAGGG 
ATGTTTGTCA TCGTAGAAGG GATATACTCA GCGTCTGGTG GATCTTCCAA CCAGTCCACA 
AACTATATTG GTGGCTGTTT CCATGTTAGT AACATTGGAC ATCCACCAGC AGAAAGGAGA 
GACGCCAGCA GTGAAAACTA CGGTAACCTC GACTTCCTAG GAATACATAA ACAAATCGGC 
AACTCTACAG CTAACGATAA GGTGCTCAAA ATCAACAAAT ACTTTAGACG GAAGTTGGCG 
ACCCTCGAGA AATCCTTAGT GGGCCACAAG TTAGTCTTAT TGGGTTCTGA GTGCCATTTA 
GACAACTTCA AAATCTTAGA TGGGCTCAAG AAATTGTTGC ACAAATTAGA GAATTCAATA 
ATTGAAATAA TGGAATCAGA GGATGGCCAT GTTCCTTTGG CTCTTGTAAT GACGGGTTCG 
TTTTCTTCAA GCCCCTTGAC GACAACCAAC TCCTTGGTGT CAAATATCTC AAACTCAGAA 
ACTTACAAGA GTAATTTCGA CAACTTTGCC AATATTTTGT CTAACTTTCC TAATGTGATC 
AAAACATGTA AGTTGGTATT GATACCTGGT AAGAACGATC CATGGCAATC CACCTACTCG 
TTGGGAGGAT CATCTCTCAA CTGTTTCCCC CAGAAATCGA TACCTAGGTT GTTCGTCAGT 
CGTTTGGAGC GGTTGCTACC TAAAGGAAAC TTGATCTTGT CATGGAATCC AGCTCGTATA 
AGCTATTTGT CTCAGGAAAT AGTAATCTTG AAGGATGAGC TTATGAACAA AATGAAGCGG 
AACGACATTA TCTTTGCCAA TGATCTAGAG GAAGAGAAGG AGAATTTGGA AAAGGTATTG 
GCTCAGAGTG AAGAGGATAG AATTAACAAT TTGGTGAAAG GAGGAGTAAC TGGAGAACAT 
ATACCTATAA AGATAAAACA TGCCAGAAAA TTGGTCAAGA CAATACTCGA CCAAGGTAAT 
CTTCAGCCAT TCTTGAGGGA GACCAAGCTC ATAAATCCAG AATACGACTA CGCTCTCAGA 
ATAGAGCCAT TACCCACTGT AATGGTACTC AATGATGCCA ACTTCGACAA CTTTGAGGTA 
ACCTACAATG GTTGCAAAGT GGTCAATGTG AGTAGCTTGT TGAGTCTGAC CAGCAGAAAG 
CTTAACTACG TGGAGTACTA CCCTTCTAAC AAGAAGTTTT CTTTCCAAGA GTTGTATTTC 
TAGAGGCGCA CTTCTATGGA ATGGCTCGAA GAAGTCTATA GCCTACCTAA TGCTTATAAT 
ACACATTTTA CTGT

Protein sequence

MESVNTLPIK LQPSNLRPIA YRVFSKKHGL NIKTDALNLL TEVISYKFSF DWKGPKSQQF 
LEEVAKTWKL EDRGLFIDAP GLKQVLKEIN TKSGSLDSSS VYGSRSSSTT SEPERAGRSD 
TLVDSEEEQN INWEDYFKFI NPDQQPHCVF DKLRKQFKVL PSTNSKSKSL IGTLPNNLQN 
TVELFNNRYH IIYDRLSRNE NFQKSSFSSI STINKSLHNG SANEITLIKN VLGRDGSKFI 
LCGLLSKDAN DSCILEDSTD YIELNLTQTY KTQGSFYCPG MFVIVEGIYS ASGGSSNQST 
NYIGGCFHVS NIGHPPAERR DASSENYGNL DFLGIHKQIG NSTANDKVLK INKYFRRKLA 
TLEKSLVGHK LVLLGSECHL DNFKILDGLK KLLHKLENSI IEIMESEDGH VPLALVMTGS 
FSSSPLTTTN SLVSNISNSE TYKSNFDNFA NILSNFPNVI KTCKLVLIPG KNDPWQSTYS 
LGGSSLNCFP QKSIPRLFVS RLERLLPKGN LILSWNPARI SYLSQEIVIL KDELMNKMKR 
NDIIFANDLE EEKENLEKVL AQSEEDRINN LVKGGVTGEH IPIKIKHARK LVKTILDQGN 
LQPFLRETKL INPEYDYALR IEPLPTVMVL NDANFDNFEV TYNGCKVVNV SSLLSLTSRK 
LNYVEYYPSN KKFSFQELYF