Gene PICST_65754 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_65754
Symbol	THR4
ID	4839718
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	-
Start bp	612899
End bp	614434
Gene Length	1536 bp
Protein Length	511 aa
Translation table	12
GC content	44%
IMG OID	640391033
Product	threonine synthase
Protein accession	XP_001385124
Protein GI	150865777
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.148721
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCAAA AGTATAGATC ATCGCGTTCT GCGGAGCCCC AGGCTTTGTC CTTTGAGGAT 
GTGGTCATGA CCGGTTTGGC CAACGATGGA GGTTTGTTCC TTCCCTCACA AGTTCCCCAG 
CTTCCAGCTT CATTCTTGCA AGACTGGGCG GATTTGTCTT TCCAAGAATT GGCTTTCAAT 
GTATTGAGAT TGTACATCAA CGCTGCTGAA ATCCCTGACC AAGACTTAAG AGACTTAATC 
TCCAAATCTT ACTCCACTTT CAGATCGGAA GAAGTCACTC CATTAAAGAA GATCGACGAC 
AAGTTGTACT TGCTTGAATT GTTCCATGGT CCTACCTATG CCTTCAAGGA TGTTGCCTTG 
CAGTTTGTCG GCAACCTCTT TGAGTACTTC TTGACCAGAA GAAATGCCAA GAAGGTTGAA 
GGCGAAGCTC GTGATGTTAT CACTGTCGTT GGAGCTACTT CTGGTGATAC TGGTTCTGCT 
GCTATCTACG GCTTAAGAGG TAAGAAGGAT GTGTCTGTGT TCATTCTCTA TCCAACAGGC 
AGAATTTCTC CTATTCAAGA AGAGCAAATG ACCACAGTAG AGGATGCCAA TGTGCACACA 
TTGTCGGTTA ACGGTACCTT CGATGACTGT CAGGACATCG TGAAGCTGAT CTTTGGAGAC 
CGCGAGTTCA ATGATAAGTA CCATGTTGGA GCTGTCAACT CCATTAACTG GGCAAGAATT 
TTGGCTCAAC AAACCTACTA CTTTTACTCA TACTTCCAAT TGCAGAAGAA GTTAAATGAC 
ACATCTGCGA AGGTCAGATT CGTCGTTCCT TCTGGTAACT TCGGCGATAT ATTGGCTGGT 
TACTATGCAT ACAAGATGGG CTTGCCAGTG GACAAGTTGA TCATTGCCAC TAATGAAAAC 
GACATTTTGG ATAGATTCAT GAAGACTGGT CGTTACGAAA AGAAAGCTGA AAAGGACGCC 
TCTGCGGCTG TCAAAGCCAC ATTCTCGCCA GCTATGGATA TCTTGATATC ATCCAACTTT 
GAAAGGTTGT TGTGGTACTT GATCAGAGAC TCCGTTGCCA ACGGTAGTGA CGAAGTTGCT 
GGTAAGACTT TGAACTCCTG GATGCAACAA TTGAAAGAGA CTGGTTCTGT TGTGGCTGAC 
CCAGAAGTTC TCGCTGGAGC CAGATCCATT TTCGATTCTG AAAGAGTTGA TGATGCTGAA 
ACTGTTGCTA CCATAAAAGA AGTTTACTCT GCTCACCCAG AAAGCTACGT GTTGGATCCA 
CACAGTTCTG TCGGTGTTAC GACTTCCTAC AGATTCATCA AGAAGGACGA CAAGAAGGAC 
AACATCAAGT ACATATCTTT GTCTACCGCC CATCCAGCCA AGTTTTCTGA AGTTGTCAAC 
AAGGCTTTGG ACTCGATCGC AGGGTATTCT TTCGAGAAGG ATGTATTGCC AGCTGAATTG 
AAGGCTTTGA GCACCAAGCG CAAGAGAATT AACTTGATTG ATGAAGCATC CATAGAAAAG 
GTCAAGGATG CCATCAAGAA GGAATTGAAC TTTTAG

Protein sequence

MSQKYRSSRS AEPQALSFED VVMTGLANDG GLFLPSQVPQ LPASFLQDWA DLSFQELAFN 
VLRLYINAAE IPDQDLRDLI SKSYSTFRSE EVTPLKKIDD KLYLLELFHG PTYAFKDVAL 
QFVGNLFEYF LTRRNAKKVE GEARDVITVV GATSGDTGSA AIYGLRGKKD VSVFILYPTG 
RISPIQEEQM TTVEDANVHT LSVNGTFDDC QDIVKSIFGD REFNDKYHVG AVNSINWARI 
LAQQTYYFYS YFQLQKKLND TSAKVRFVVP SGNFGDILAG YYAYKMGLPV DKLIIATNEN 
DILDRFMKTG RYEKKAEKDA SAAVKATFSP AMDILISSNF ERLLWYLIRD SVANGSDEVA 
GKTLNSWMQQ LKETGSVVAD PEVLAGARSI FDSERVDDAE TVATIKEVYS AHPESYVLDP 
HSSVGVTTSY RFIKKDDKKD NIKYISLSTA HPAKFSEVVN KALDSIAGYS FEKDVLPAEL 
KALSTKRKRI NLIDEASIEK VKDAIKKELN F