Gene PICST_43096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_43096
Symbol	DIE2
ID	4838305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	1135486
End bp	1136883
Gene Length	1398 bp
Protein Length	465 aa
Translation table	12
GC content	39%
IMG OID	640389620
Product	glucosyltransferase
Protein accession	XP_001383848
Protein GI	150864855
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.708454
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTTGG TTATACCTAG GGGTGGCTCC ATAGTCCGCA AGAGACTCAT TACACTCTTG 
CTAACATTGA GTACAGTTGC ATTCTGCGGA TATGTCCATC ATCAAGTCAG TCTCAAGGTC 
AAGAACCCAT ACATAGACGA ATACTTCCAT ATCCGCCAGT GCCAGAAGTA CTGCCAACAT 
AAATTCCACG AATGGGACAA CAAGATCACA ACTCCACCAG GGTTGTACGT ATTGGGGTTC 
TTATACACGA ATGCCATTCA GAAGCTTTCT GGGGCAGAAT CGAACTACTA TTGTGGAAAC 
TACGATATCT TGAGATCAGT GAATTTACTA GGTTTCTTTG CTCTTTTGGC AATTGCTCAT 
CGTTTCAAGA AATCTTATGG AAACCAATAC CTTTCGATCA ACATAGCGTC CCAGCCGTTG 
CTATTCACCT ACTATTTCTT GTTCTATACT GACATATGGT CAACAGTATT TGTAGTGCTA 
GCACTTACAA TTGTCATGTC CAAACCTGTG AGAGACTACC AGGCTTATTG CAGTGGATTA 
CTTGGTTTGT TGAGTTTGTG GTTCAGACAA ACAAATATCG TTTGGGTCGC CTTCATTCTT 
GCTGTACTTG TGGAAAGAAG TGTAGTCAGA AAAAGAGGCG AGAGTCCTAA CTTCTTGGCT 
CAGACACTGC TGTTCATATC TCTGTTCTTT AAGAACTGGT TCAAGATAAT TCCATTCGTA 
ATAAATGCTG TGCTCTTTGC GATTTTTCTC AAGATCAATG GTGGTATTAC CTTTGGCGAT 
AAAGAGAATC ACGAAATCCA ATTGCACGTG GTTCAAGTCT TTTACTGTTT CACATTTATT 
GTTCTCTTCA CTTGGCCAGT ATGGTTTGAT GTTCATTGTT TGAAGAGATA CCTCAAATTT 
GTCTTTGTTC AAAACTATGG TCTTAATTTC GGTTTGAATG TGGTGAGTTT GTGTGCTATA 
AAATACGTCA TAGACAATTT TACTGTTGTC CATCCATTCT TGTTGGCTGA TAATAGACAT 
TATACATTCT ACATATTCAA GCGACTCATT AGCCATCCAA AGAGTTACAT CATAGCTGTG 
CCATTATACC ACTTTGCAAC CTATTCTATA ATTAGTTCAT TGTCCCAAAG TGATAAGATC 
AACATGAGAT TTGTCACCAT TGTGTGCTAC TTGGCCGCAG TGTGCTTGAC TATCATTCCT 
TCGCCATTAT TTGAACCACG ATACTACATT GTTCCATTGG TGATATTCAG ACTCTTCATA 
AAGCCTGTCA ACACAAAGAG ACACTACTTG GAGTTTATTT GGTTAAACAC TATAAACGTT 
GTTACTACAT TAGTATTCTT AAACTATGAG TTTACATGGG CAAGTGAGCC GGGTAGCATT 
CAGAGAATAA TATGGTAA

Protein sequence

MALVIPRGGS IVRKRLITLL LTLSTVAFCG YVHHQVSLKV KNPYIDEYFH IRQCQKYCQH 
KFHEWDNKIT TPPGLYVLGF LYTNAIQKLS GAESNYYCGN YDILRSVNLL GFFALLAIAH 
RFKKSYGNQY LSINIASQPL LFTYYFLFYT DIWSTVFVVL ALTIVMSKPV RDYQAYCSGL 
LGLLSLWFRQ TNIVWVAFIL AVLVERSVVR KRGESPNFLA QTSSFISSFF KNWFKIIPFV 
INAVLFAIFL KINGGITFGD KENHEIQLHV VQVFYCFTFI VLFTWPVWFD VHCLKRYLKF 
VFVQNYGLNF GLNVVSLCAI KYVIDNFTVV HPFLLADNRH YTFYIFKRLI SHPKSYIIAV 
PLYHFATYSI ISSLSQSDKI NMRFVTIVCY LAAVCLTIIP SPLFEPRYYI VPLVIFRLFI 
KPVNTKRHYL EFIWLNTINV VTTLVFLNYE FTWASEPGSI QRIIW