Gene PICST_41267 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_41267
Symbol	GPH2
ID	4836995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	+
Start bp	761990
End bp	763210
Gene Length	1221 bp
Protein Length	406 aa
Translation table	12
GC content	44%
IMG OID	640388310
Product	glycerol-3-phospate dehydrogenase
Protein accession	XP_001382385
Protein GI	150863788
COG category	[R] General function prediction only
COG ID	[COG0579] Predicted dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.847058
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0947149
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTTTAT CCCAATTCAG CCCGATTTTC AGGCGAAGCT TTTGTTCTTC TTCTCGGTAT 
TGCTCAGACT TTTCTCATGT AGTGATTGGA GGAGGGGTGG TAGGAACAGC AATTGCTGCT 
GAGCTACTGG AAGTTGCTGG CAACAGCGTT CTCCTTGTTG AAAAGAATGA AGATTTGGGC 
ATGGAAACCA CCTCAAGGAA TTCGGAAGTG ATACATGCTG GGTTGTACTA CCCTCAACTC 
AGTCTCAAGG GACAACTCTG TATCCGAGGA AAGAACAAAA TCTACGAAGC CAATGACAAG 
GGACTCTTTC AAGTGGCACT ACAGAAGTGC GGAAAGTGGG TAGTTGCACA GAATGAACTG 
GAGGAAGCAT ATTTGGAAAA GCTTTATCAG AATAGTCGGG ATCTTGGAGT TCCAGTGTCC 
ATGATTTCTG CTTCTGAAGC TAAGCGCAAG TATCCGTTGA TAAGGGCTGA AGCTGGGGCT 
CTAAATAGTC CTACAACGGG TATCATTTCA GCACATGAGT TGACAACCTT CTATCAGAGT 
AAAGTAGAAA ATAACGATGG AACAATTGCC CTTAACACCA GAGTAGTTGA CATTGGCCCT 
AATTTGGCCA CACCCAACTA TACCTTAAGA TTAGTTGATA TAGAAGGTTC AGATATGGAA 
GTCACCACTG ACAATGTCGT CAATTCTGCA GGTCTCTATG CTCAGAAAAT AGCCAATCTA 
GTGCTACCTC CAGATAGACA GTACCAAAGT TACTTTGCTA AAGGTAGCTA TTTCAGTTTC 
CAGCCAGAAG TAGCCTTAAG CCACAGCAAG ATCACGGACA AGTTAATCTA TCCATGTCCA 
AACCCCAATG CTTCATCTCT AGGTACACAT TTGACACTAG ATTTGGGTGG ACAAATCAGA 
TTTGGCCCTG ACCTCGAATG GCTTGATATA GAGGATGCTT CTGAGATAGA CTACCGGGCA 
AGCACAAACA ATTTGGATGC CGCATACAAA GCAATTCAGA CATATTTTCC TAGCGTGACA 
CCAGGCTCAC TTCAACCATC TTACTCTGGA GTGAGACCAA AGTTATTGTC GGCAGCAGAC 
AGCAAAAAGC ACTTTGCCGA TTTTGTTATC AAAGAAGAAG ATGGATTCCC TGGATTTGTC 
AATTTGTTGG GTATTGAGAG TCCGGGATTG ACTGCCTCTT GGGCTATTGC TGACTATGTA 
AAAGAAATAT ACCATGGATA G

Protein sequence

MRLSQFSPIF RRSFCSSSRY CSDFSHVVIG GGVVGTAIAA ELSEVAGNSV LLVEKNEDLG 
METTSRNSEV IHAGLYYPQL SLKGQLCIRG KNKIYEANDK GLFQVALQKC GKWVVAQNES 
EEAYLEKLYQ NSRDLGVPVS MISASEAKRK YPLIRAEAGA LNSPTTGIIS AHELTTFYQS 
KVENNDGTIA LNTRVVDIGP NLATPNYTLR LVDIEGSDME VTTDNVVNSA GLYAQKIANL 
VLPPDRQYQS YFAKGSYFSF QPEVALSHSK ITDKLIYPCP NPNASSLGTH LTLDLGGQIR 
FGPDLEWLDI EDASEIDYRA STNNLDAAYK AIQTYFPSVT PGSLQPSYSG VRPKLLSAAD 
SKKHFADFVI KEEDGFPGFV NLLGIESPGL TASWAIADYV KEIYHG