Gene PICST_41330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_41330
Symbol	TPS1
ID	4837586
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	+
Start bp	1448341
End bp	1449759
Gene Length	1419 bp
Protein Length	472 aa
Translation table	12
GC content	46%
IMG OID	640388901
Product	Trehalose-6-phosphate synthase
Protein accession	XP_001382500
Protein GI	126131950
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0380] Trehalose-6-phosphate synthase
TIGRFAM ID	[TIGR02400] alpha,alpha-trehalose-phosphate synthase [UDP-forming]

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.336184
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.497082
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTAGTCG GCAAGGTCCT TGTAGTCTCC AACCGACTTC CAGTAACCAT CAAGCGTTCT 
GACTCCGGCT CCTACGACTA CTCGATGTCT TCCGGGGGTC TAGTCACCGC ACTTCAAGGG 
TTGAAGAAGT CAACAGAATT TCAGTGGCTA GGCTGGCCTG GTTTGGAAGT ACCTGCGGAC 
GAACAGGAGA GAGTCAATTC CGACTTGAAG TCGAAGTTTA ACTGTACAGC CATCTATTTA 
AGTGACGTTA TAGCTGATTT GCACTATAAT GGCTTCTCCA ATTCAATCCT TTGGCCGCTT 
TTCCATTACC ATCCGGGTGA AATGAACTTT GACGAAAACG CCTGGGCTGC TTATATCGAA 
GCCAACCGCC AGTTTGCCGT AGAAATAGCA GGCCAGGTCA ATGACAACGA TATGGTATGG 
GTGCACGATT ACCACTTGAT GCTCTTGCCT CAGATGTTGC GGGAAGAAAT CGGCAACAGA 
AAGAAGAATA TCCGTATCGG TTTCTTCTTA CACACGCCGT TTCCATCGTC AGAAATATAT 
AGAATTTTGC CCGTAAGAAA AGAGATCTTG GAAGGTGTTT TGAGCTGTGA CTTGATCGGC 
TTCCACACCT ATGACTATGC CAGACACTTC TTGTCTTCAG TATCGCGTAT TGTAGCCGAC 
GTGACTACTT TACCCAATGG AATTGAGTTC CAGGGAAGAT CTATCAGTAT TGGGGCTTTT 
CCCATCGGTA TCGACGTCGA CAAGTTCACT GAGGGCTTGA CCAAACAGTC GGTTATCGAC 
AGAATCAAGC AGTTGAAGTC CCGCTTTGGT GACACCAAGA TTATCGTGGG GGTAGATCGC 
TTGGATTACA TCAAGGGTGT CCCCCAGAAA CTCCACGCAT TCGAGGTTTT TTTGGAAGAA 
AACCCAGAAT GGATCGGCAA AGTAGTCTTG GTCCAAGTTG CAGTGCCTTC TAGAGGCGAC 
GTAGAGGAGT ACCAATCACT CAGAGCTACT GTTAACGAGT TGGTAGGTAG GATAAATGGG 
AAGTTTGGAA CCGTGGAATT TGTACCTATC CATTATATGC ATAAGTCCGT GCCCTTTGAC 
GAGTTGATAA GCTTGTACCG TGTGTCTGAT GTCTGTCTTG TCAGTTCTAC AAGAGACGGA 
ATGAACTTGG TTTCTTACGA ATACATCGCT TGTCAGCAGG AAAACAACGG GGTATTGATA 
TTGTCTGAGT TCGCTGGTGC TGCGCAATCG TTGAATGGAG CTATCATTGT CAATCCATGG 
AATACAGAAG ACTTGAGCAT TTCTATCAAG GAAAGCTTGA CGTTACCAGA AGAAAAGAAA 
GCTATCAACT TCAACAAGCT CTTCACTTAT ATCTCCAAGT ATACTTCCGG CTTCTGGGGT 
GAAAGCTTCG TCAAAGAATT GTACAAATGC ACATCTTGA

Protein sequence

MVVGKVLVVS NRLPVTIKRS DSGSYDYSMS SGGLVTALQG LKKSTEFQWL GWPGLEVPAD 
EQERVNSDLK SKFNCTAIYL SDVIADLHYN GFSNSILWPL FHYHPGEMNF DENAWAAYIE 
ANRQFAVEIA GQVNDNDMVW VHDYHLMLLP QMLREEIGNR KKNIRIGFFL HTPFPSSEIY 
RILPVRKEIL EGVLSCDLIG FHTYDYARHF LSSVSRIVAD VTTLPNGIEF QGRSISIGAF 
PIGIDVDKFT EGLTKQSVID RIKQLKSRFG DTKIIVGVDR LDYIKGVPQK LHAFEVFLEE 
NPEWIGKVVL VQVAVPSRGD VEEYQSLRAT VNELVGRING KFGTVEFVPI HYMHKSVPFD 
ELISLYRVSD VCLVSSTRDG MNLVSYEYIA CQQENNGVLI LSEFAGAAQS LNGAIIVNPW 
NTEDLSISIK ESLTLPEEKK AINFNKLFTY ISKYTSGFWG ESFVKELYKC TS