Gene PICST_49223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_49223
Symbol	GRP3.4
ID	4840508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009047
Strand	+
Start bp	1060895
End bp	1061905
Gene Length	1011 bp
Protein Length	336 aa
Translation table	12
GC content	43%
IMG OID	640391823
Product	protein induced by osmotic stress
Protein accession	XP_001386209
Protein GI	150866566
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.376808
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACTG TCTTTGTCTC CGGAGCCAAT GGGTTCATTG GACAGCATAC TGTTCAGCAA 
TTGTTAGAAG CTGGTTACAC TGTGATTGGA TCCGTAAGAT CGCAAGAAAA AGGTAAAAAG 
TTGCTGACGG CATTGAAAAG CGACAAGTTC TCGTTCGTAG TCATTCCCAA CATTGCTGAC 
GTTGGAGCTT TTGACAAAGT GTTGGATGAC AATAAGCAAA TCACCACATT TTTGCATATT 
GCTTCTCCCT TCAGATTTAA TGTTCAAGAC ATTGAGAAGG AAATATTGAT TCCTGCAATT 
GAAGGTACCA GAAACGTCTT GACCTCTATC AAGGACCATG CTCCACAGGT TACGAAGGTT 
GTTGTTACAT CTTCTGATGC TGCTGCCAGA GAAAACGACG ACAAGAACCC AGACCTCACT 
CTTGACGAGT CGGTATGGAG CAAGGCTACT TACGAAAGTT CTAAACACGA CCCAGTAGCT 
GCATATCTTG GCTCCAAGCC TTTGGCTGAG AAATTGGCGT GGAAGTTTGT TGAAGAGGAA 
AAGCCAAACT TCAAGTTGAT CACCGTGTTG CCAAGTTACA CCTTTGGCCC TCAGATTGAT 
GATTCCTTAG TGTTGAAGGA CTTGAACTCG TCCTCTAAGG TGTTTGAAGA AATCATTACG 
CTGAACCCAG ACTCTCAATT GTATACTCAC AATGGTAGCT TTGTTGATGT GAGAGACGCT 
GCCAAAGCTC ATTTAGTAGC CTTCCAAAAT GACGAAGCCA TTGGCAAGAG ATTAATCTTG 
TCCAGTAATA GATTCACCTC ACAAACTATT AGAGATATTC TTCTCAAGGA ATTCCCACAA 
TTCAAGGGAC AGATCTTCGA AGGTGTGCCT GGTGAAGACA TTGAAGATAT CAAGCAAATG 
CCTGTGTTAA ACTACTCACA AACCAACAAC ATCTTGGGCT TCAAATTCAG AGACATCAAG 
ACATCCTCAG TTGATGCGGT AGCACAACTC TTGAGAGTTA GAGATGCTTA A

Protein sequence

MTTVFVSGAN GFIGQHTVQQ LLEAGYTVIG SVRSQEKGKK LSTALKSDKF SFVVIPNIAD 
VGAFDKVLDD NKQITTFLHI ASPFRFNVQD IEKEILIPAI EGTRNVLTSI KDHAPQVTKV 
VVTSSDAAAR ENDDKNPDLT LDESVWSKAT YESSKHDPVA AYLGSKPLAE KLAWKFVEEE 
KPNFKLITVL PSYTFGPQID DSLVLKDLNS SSKVFEEIIT SNPDSQLYTH NGSFVDVRDA 
AKAHLVAFQN DEAIGKRLIL SSNRFTSQTI RDILLKEFPQ FKGQIFEGVP GEDIEDIKQM 
PVLNYSQTNN ILGFKFRDIK TSSVDAVAQL LRVRDA