Gene PICST_35359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_35359
Symbol
ID	4837848
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	+
Start bp	27509
End bp	28783
Gene Length	1275 bp
Protein Length	424 aa
Translation table	12
GC content	42%
IMG OID	640389163
Product	predicted protein
Protein accession	XP_001383278
Protein GI	150864455
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3616] Predicted amino acid aldolase or racemase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTACC CTGCTCAATT CATAGCAAAA CCAAGCAAGG AAGCTTTACT CGATGCTTTC 
AAGGGGAAGC TGATATCCAG CTTGCCTACC CCTTCTTTTC TTATCAATGA AGATATATTC 
ACCAAAAATT GCAATAGAAT GCTTCAGAAT ACTTCGCACT TGAGTGCCGA TTTCCGAGCT 
CACGTCAAAA CCCACAAGAC AGTAGAAGGC ACTCGTTTGC AATTGGGAGA AAAGTCACCG 
ATCAAAACCG ACAAAATTGT GGTCTCCACG TTAGTGGAAG CTTGGAGTCT AATGCCACTT 
GTGGAAGAGG GCTTGATTAG CGATATTTTG TTTAGTTTGC CTGTTGTGAA GTCCAGGCTC 
CCTGAATTGG CCGAATTGGC AAACAAAGTT CCCCACTTAC GGTTGATGCT CGATGGATCA 
GATCAGTTGG AATTGTTGGC AGACTTCTCC AGAGAATTTT CCATAAAAGC AAAATGGTCT 
ATCTTCGTTA AGATCAATAT GGGAACAAAC AGAGCTGGCT TAGTCAACGA ATCCACCTCT 
TTAGAGAATA CTTTACAAAA ACTCTTAAAG GATGATAAAA TTAGCGAGTT TGTGGACTTA 
TATGGGTTCT ACTGTCATGC TGGTCATTCG TATAGTGCGG ATTCTCCTCT GTCAGCTAAA 
GATTTCTTAA TTCAAGAGAT TATCCACGCT AATCAGGCTG CAAAAGGAGC ACTCCAAATA 
CAGCCAGGCT TGAAACTCCA AATTTCTGTC GGTGCAACGC CTACAGCTCA TTCTTCGGAA 
CACTTGAATA CAGATGAATT GATAGCAGCT ATCGGAGATG AACTTTCAGG AAAATTGGAA 
TTACATGCTG GTTGCTATCC ATGTTGTGAC TTGCAACAAG TTTCTACTGG TTGTGTTACG 
CTTGAAGAGG TGTCCATTTC TTTATTGGCC GAGGTTATCT CAATTTACCC GAACAGAGGT 
TCCAAGGCTC CAGGGGAACA ACTTGTCAAT GCTGGAGTTT TGGCCTTATG TCGAGAATTT 
GGACCTTTAC CAGGCCATGG TAGAGTGGTT GATCCTCCAG GACTTGAAAA TTGGATTGTT 
GGTAGATTGA GTCAAGAACA TGGGATCTTA GTTCCACTTG ATGAAAACCA AGTTAATGAC 
TTTATTCCTT TGGGAACCAA AGTAAGAATT GTCCCACAAC ATTCTTGCAT CACAGCAGCA 
GCTCATCCTT GGTACTATAT AGTAGACTCC AGTAATAGTG TAGTTGACAT TTGGATACCA 
GCTAGAGGAT GGTAG

Protein sequence

MSYPAQFIAK PSKEALLDAF KGKSISSLPT PSFLINEDIF TKNCNRMLQN TSHLSADFRA 
HVKTHKTVEG TRLQLGEKSP IKTDKIVVST LVEAWSLMPL VEEGLISDIL FSLPVVKSRL 
PELAELANKV PHLRLMLDGS DQLELLADFS REFSIKAKWS IFVKINMGTN RAGLVNESTS 
LENTLQKLLK DDKISEFVDL YGFYCHAGHS YSADSPSSAK DFLIQEIIHA NQAAKGALQI 
QPGLKLQISV GATPTAHSSE HLNTDELIAA IGDELSGKLE LHAGCYPCCD LQQVSTGCVT 
LEEVSISLLA EVISIYPNRG SKAPGEQLVN AGVLALCREF GPLPGHGRVV DPPGLENWIV 
GRLSQEHGIL VPLDENQVND FIPLGTKVRI VPQHSCITAA AHPWYYIVDS SNSVVDIWIP 
ARGW