Gene PICST_33544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33544
Symbol	GPI17
ID	4840673
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009047
Strand	-
Start bp	925507
End bp	927063
Gene Length	1557 bp
Protein Length	518 aa
Translation table	12
GC content	38%
IMG OID	640391988
Product	Glycosyl Phosphatidyl Inositol 17
Protein accession	XP_001386366
Protein GI	150866691
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGAGA CGGAGAGTGA AAATGGCCTC AAGGTTCAAA ACCAGGAAGT TCCTGAGTCA 
GACACAATTG CATATATCAG ACGTCTCATT GTGTTTATTG TAGCACTCAC AGTATTGGGC 
TTAGGTTATC CAGTTTTGCA ATTTACAACA GCCATATACA GAGCAGACTT GCCGGTAGAT 
GAAATCACAA GTTTGGCCAG CACATTACAC AACGACATTC TGTTCAAAAT CCCCGTCTAT 
TTAGACATAC CGACCACGTT AGACGTCTTT ATTCCTGATT CTCAGGAGAA GTTGAACCAA 
TTTGTCAACT CCAAGTATCC AGAACTTGCT AATTTTTGGT CGCTCGACTT GAAAAAAATC 
ACACCTGGCA TTGATCCGGA AATTGACTAT GTCGTGAAAC TTGTTCAAGA TGAAAATGAA 
AATGGAGACG ATGCTGTTGA TATGTCTCCA TTTTCAAAGG AAACTACGTT GAAAGTGTCG 
CAGAATTGGA TAGACTCTAA GTTGGTGGAC CAGGTTTTGT CTTCAGTACT TGTAGACATG 
GTTTTCAAAG AGGAAATATC TGAATTAGTG TCTATTATCA ACAATAGGGC CAAAGAGTTG 
GATAAAAACA TTGTTGTTCC ATATTCACCG AACTACAATT TAGTCTTTTC TCTACTTGTA 
GAAAATGGTA GAACTGTCAA GTGGGATATT GAGACTGCTC TCAAGCAAAT GAAACCATTC 
TTAAACAAAT TGACCCACTA CACCAACTTC TCTATCAGCA CTCAGGTTCA GTACTACTCT 
AAGACTGAAA AACCTGTGGT GTTTGACGAG AAGAAAAATG CTTACATTTT GAAGGAATCA 
GATTTGTCAA CTTTCATCAA CTTTGGTGAC TGGAATTTGA ACACACATGA TATGGATCCT 
TCTATTAACT TCTTGGTCTA CTTCCCAGAA TCTAATTACG AAAACAAGCC TTGGGTGATT 
GACCACTTGG ATAACGGTGC CTTTTTGGTG AAGCAATGGG GTGGTGTATA CATTTTCAAT 
AAGGAAAAGC CGATTCTTGA AGGATATGAT GTCAACATTA CTGAGTTGGA ATTGATCCCA 
ATATTGGAAA TTTTTACCTC TCAGCTTTTC CAGTTACTTG GCTTGGCCAC GTTTCCCAAG 
TCACCCTCTA TGAGAGTCGA TACCTTGACA AGATTGACCT TATTTAAAAA TTTGAAAAAA 
ACATTGGAAA ACTTACATTC TCTTGTCAAG CTCACAGTTT CATTGAATGA AATATCTATT 
CCAGATGAAA CTAAAGAACA TGTCTTGAAG TCTATCGAAT TGGTTAAGTT GGCCATTAGC 
GAAATTAACC AAAAACAAAA CTACCATAAT TCCATGACCA TATCATCAAA GGCTTTAACG 
ATTTCTGACA GAGCCTTCTT TGACAAAGAA ATGGTCCAGC AAGCGTACTT TCCAAATGAA 
CATAAGATGG CGGTCTTCTT GCCCCTCCTT GGGCCTGTCA CTTCTATTTT GGCCATAGCG 
TTAATCAAGA TCTTAGTTAG TTTCAAAACA GGGTTGAAAA AAAAGAAGGC CGATTAA

Protein sequence

MTETESENGL KVQNQEVPES DTIAYIRRLI VFIVALTVLG LGYPVLQFTT AIYRADLPVD 
EITSLASTLH NDISFKIPVY LDIPTTLDVF IPDSQEKLNQ FVNSKYPELA NFWSLDLKKI 
TPGIDPEIDY VVKLVQDENE NGDDAVDMSP FSKETTLKVS QNWIDSKLVD QVLSSVLVDM 
VFKEEISELV SIINNRAKEL DKNIVVPYSP NYNLVFSLLV ENGRTVKWDI ETALKQMKPF 
LNKLTHYTNF SISTQVQYYS KTEKPVVFDE KKNAYILKES DLSTFINFGD WNLNTHDMDP 
SINFLVYFPE SNYENKPWVI DHLDNGAFLV KQWGGVYIFN KEKPILEGYD VNITELELIP 
ILEIFTSQLF QLLGLATFPK SPSMRVDTLT RLTLFKNLKK TLENLHSLVK LTVSLNEISI 
PDETKEHVLK SIELVKLAIS EINQKQNYHN SMTISSKALT ISDRAFFDKE MVQQAYFPNE 
HKMAVFLPLL GPVTSILAIA LIKILVSFKT GLKKKKAD