Gene PICST_35844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_35844
Symbol	GLP1
ID	4838574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	510967
End bp	512178
Gene Length	1212 bp
Protein Length	403 aa
Translation table	12
GC content	45%
IMG OID	640389889
Product	Glycerophosphodiester phosphodiesterase
Protein accession	XP_001384392
Protein GI	150865251
COG category	[C] Energy production and conversion
COG ID	[COG0584] Glycerophosphoryl diester phosphodiesterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.313147
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATCCG ACTCCCTCGA CACATATACA TCTCCGGTCA TAGCGGGCCA CAGAGGATTC 
AAGGGCGAAT ACCCCGAGAA CACCCTTACG GGATTCAACA AGTGCTATGA AACCGGGGCC 
ACGGTGATAG AAACAGACCT TTGGCTCACC CTCGACGAAG TAATTGTCAT CTCCCATGAT 
CCCAATACGA AGAGAGTGTT TGTAGATTCC GAGGGTAATG AAACTGACTA CAACATTCCT 
AAGACTAGCT ACGAGGAGGT GTTGAAGTAC TTGAAGACAA AAGAAGGTGG AGAACCGCTT 
CTAACTTTCC GCGAAGTGTT GCAGTGGTTC GTAGACTATG TGAGCGAATC CAGATCTAAC 
ATCCACAAGT TGATGTTGGA TATCAAGCGT CTTAATCCTG CCAAAGTGTT GAAGTTCATC 
ATTGGCGATC TCCTTGCCGT CAACAACGAC ATCTCCTGGT GGTTCCACCG TATCCAGTTG 
GGTGTATGGG ATTTAAATGT CGTCAAATAC ATGAACCAAG ACGAGTTCTT CCAGAGTTTA 
GTCAAGAATT CTCACGGAAA GAATCCCTTG GGCTGGGTCT GGTTCGACGT GTTCCATATT 
TCAGTATCGT GGAGAGACTC CATCCACTAC ATAAACTACA ATTTCTACCT TGATACACTC 
AAGGATGAGG ATAGCAAGAC CGGAATTGTC CGGTTCAAGG TAACAGGAAT TTCTTTGCTC 
TACTTCCTGA CGTGGTCAAC AGGATTTCTC ACCAAGTTCT TACCGTTGCT TCGTATCCAG 
CGCTTGAAAT TATACTCTTG GACGATTAAT ACAGCGGTTC AGTATGACTT CTTGAGCAAG 
GTCGGGAAAG TAGCTGATTT GCCAGAGTAC GGTGTCATTT CTGACTATCC GGACCAGATG 
GTGAAACACA AAGAGGATGA AGAAAGAAAG GAAGAATTCG AAAAGAACTC TGTTGACGAA 
TTATCGAGGT TGACTCCTTC CTCTACTGAT TACTACGACG AGGATGGCAA TTTGTCGGTG 
AAGCTAACAT TCAGAATGAA ATTCGGAAAC TACTTCTACG AAAGTTTTCA GGCTTTGGCG 
GGATCAAAGA GAATTACAGA TGAGGAGAAG CAGTTTGATC TTGAGGTTGA TGAGAATAAG 
GTCGCTGTTG TCAAGGTTAG CCAACTTTTC ATCTGGGTTT TTTCTACGTG CCAGAAGTTG 
GGTATTTTCT GA

Protein sequence

MTSDSLDTYT SPVIAGHRGF KGEYPENTLT GFNKCYETGA TVIETDLWLT LDEVIVISHD 
PNTKRVFVDS EGNETDYNIP KTSYEEVLKY LKTKEGGEPL LTFREVLQWF VDYVSESRSN 
IHKLMLDIKR LNPAKVLKFI IGDLLAVNND ISWWFHRIQL GVWDLNVVKY MNQDEFFQSL 
VKNSHGKNPL GWVWFDVFHI SVSWRDSIHY INYNFYLDTL KDEDSKTGIV RFKVTGISLL 
YFSTWSTGFL TKFLPLLRIQ RLKLYSWTIN TAVQYDFLSK VGKVADLPEY GVISDYPDQM 
VKHKEDEERK EEFEKNSVDE LSRLTPSSTD YYDEDGNLSV KLTFRMKFGN YFYESFQALA 
GSKRITDEEK QFDLEVDENK VAVVKVSQLF IWVFSTCQKL GIF