Gene PICST_42452 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_42452
Symbol	GRP2.1
ID	4836960
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	+
Start bp	345996
End bp	347006
Gene Length	1011 bp
Protein Length	336 aa
Translation table	12
GC content	44%
IMG OID	640388275
Product	dihydroflavonol-4-reductases
Protein accession	XP_001382297
Protein GI	150863730
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTACAA CTACCGTTTT TCTCTCGGGT GCCACTGGTT ATATCGCACA GCATATAATT 
GTCCAGCTTC TTTCTAAGGG GTATAATGTG GTTGGTTCTG TCAGATCGCA AGAGAAGGGT 
GAAAAGTTGA AGTCTACATA TGGTGAACAA TTTCAGTATG TTGTTGTACC TAGCTTAGAC 
CAAAAGGGTG CTTTCGATGA AGCCTTGAAG CAACATCCTG AAGCCACCAT ATTCTTACAC 
ACTGCTTCTC CTGTAACTTT CTCTAGTGAA GACAACGAGA AAGATATCTT GATTCCTGCT 
ATCGAAGGAA CCAGAAATGC CTTACAAGCT ATTTATGACC ATGCTCCTCA GATCAAGAGG 
GTTGTTTTGA CCAGTTCTAC AGTCTCGTTA GCTGACATTG ATGATTTCCA AATTCCTTCG 
CTCAAGTTGA ACGAAGAGTC GTGGGCCAGT GTTACTTATG AAGATGGTAA GACCAAAGAT 
GCCATGACCG CCTACTGGGC TTCCAAGAAG TATGCTGAAA AGGCAGCCTG GGCTTTTGTT 
GAATCCAATA AACCCAACTT CGCCCTCTCC GCCGTCCTTC CTTCATATGT GTTTGGACCT 
CAAGCACACG ATGCCGAAGC TAAGGGTCAA ATGAACTTGA CTGCTGAAGT TTTTGCTAGT 
GTTTACCGTT TGTCCAAGAA CGATGAGGTT CCTGAAGTAG CTGGTCCTTT TGTTGATGTC 
AGAGATGTGG CCAAGGCTCA CATTGTTGCT TTCGAGAAGG ATGAAGCCAA GGGTCAAAGA 
ATCATTACCA GCAGTGCCAG ATTCAATGCG CAGCTGATCT TGAACATCAT CAGAGATAAG 
TTTCCCGATC TCAGAGAGAA ATTGCCAGTT GGAGTTCCTG CCAATGGCGA TGTCTCTGAG 
TTTGTCCGCT GGGATGACCA GAAGTCTAAG AATTTGTTGG GTTTCGAATT CTCTGATCTT 
GAGAAGGTAG TTGTCGATAC TATCGAGCAA GTGATTAGAG CCAACAAATA A

Protein sequence

MSTTTVFLSG ATGYIAQHII VQLLSKGYNV VGSVRSQEKG EKLKSTYGEQ FQYVVVPSLD 
QKGAFDEALK QHPEATIFLH TASPVTFSSE DNEKDILIPA IEGTRNALQA IYDHAPQIKR 
VVLTSSTVSL ADIDDFQIPS LKLNEESWAS VTYEDGKTKD AMTAYWASKK YAEKAAWAFV 
ESNKPNFALS AVLPSYVFGP QAHDAEAKGQ MNLTAEVFAS VYRLSKNDEV PEVAGPFVDV 
RDVAKAHIVA FEKDEAKGQR IITSSARFNA QSILNIIRDK FPDLREKLPV GVPANGDVSE 
FVRWDDQKSK NLLGFEFSDL EKVVVDTIEQ VIRANK