Gene PICST_47494 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_47494
Symbol
ID	4839097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	+
Start bp	589846
End bp	591273
Gene Length	1428 bp
Protein Length	475 aa
Translation table	12
GC content	41%
IMG OID	640390412
Product	predicted protein
Protein accession	XP_001384779
Protein GI	150865525
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1362] Aspartyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0555555
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CTTGACCTGT ACTACGAGGC TTATGCTCAA CAGTATATAG ATTTCATGTC ACAGAACCCT 
ACAACTTATC ATGTTGTAAC TCATTTCAAG TCCTTGTTAA CTAACAACGG ATTCAAATAT 
ATTCGGGAAA ATGAGCCCTT CACTGCTGAT GAACCCGGCT TTTATTTTAC TTCCAAAGAC 
GACTCAACTC TTGTTGCATT CGTTGTTGGT GGAAAATGGG AACCTATTAG GGGTAGTTGT 
TTCATAGGAA GCCACTGTGA TGCATTGAGT GTCAAGATTA ACCCTGGAGG TCTGATAAGA 
AAAGGTGCAG AAGACTACTC TCTTTTAGGA GTAGCTCCAT ACTCAGGAAG CTTGAACGAA 
TTATGGTTGA ACAGAGATCT CGGCTTGGCG GGATCGCTTT TGGTTAAAGA TCCAGCTTCT 
GGAAAATTGG CTCGTAAATT GATCAATTCT GCTCCTCATC CAATTGGCTT CATACCCCAA 
TTGGCTCCGC ATTTTGGAAT CGAAAAGAAG TACAACAAAC AGACAGAAAT GGTTCCCATT 
GTCGCGTATT CGTCAGATAA GGATCTTGTC CCAACGGATG AAGAAAAGTC ATCGCATCTT 
TACTCAAAGT ACCCTTTGTC CTTGTTACGT TACATCACCA CGTTATCAGG ATACTCACTT 
TCTTCCATAG TACAAATGGA CTTGGATCTT GTAGACGTTC AACCTGCTGC TAGAGGCGGT 
CTTGGTAGAG AGTTCATCTA TTCTTCGAGC TTAGACGATA GATTATGCTC ATTTGATTCT 
GTCTATGGTC TCATAGAATT CAGCCAATCC TTCTATGGCT CTGAGGATAT TAACGAATAC 
AACGGATTGA GTGGTATATA CTTGGCTAAT CATGAGGAAA TTGGCAGTGC AACTAGAACA 
GGAGCTGCAG GTGGTTTCTT GCTTGATTCG TTGAAGTCTA TCGTAGGTTC TCGTTACAGA 
ACAAACAATG CGGAGAGATT ACTAGAGTTG ACTAATAATT CCGTGTTATT ATCGACTGAT 
GTCACCCATG CATTGAACCC AAACTTCAAG GATGTATATC TTGACAAGAA CTTCCCTCTT 
CCCAACACTG GCCCTAGTAT TAAATTTGAC TCTAATGGCC ATGTGTTGAG TGATTCCTTT 
GCCTATCAGT TCTTGTCGTC GATTATTCAA AAGCACGTTC CTGAAATTAA GTTACAACAT 
TTTCATATTA GAAACGACAG TAGATCCGGT GGCACTATCG GACCGATTAT GAGTAATGCT 
AGTAGAGGTT TGAATGGTGC CAAGTTGATT ATTGACGTTG GATTGCCTAT TCTCAGCATG 
CACTCCATTA GAAGTATCAT GGGCTACAAA GATGCCGGTA TTGGTGTGAG ATTCTTCAAG 
CAAGTGCTCA GTAATTGGCA GGACGAAGTA GCACACTTGG ATATTTAG

Protein sequence

LDSYYEAYAQ QYIDFMSQNP TTYHVVTHFK SLLTNNGFKY IRENEPFTAD EPGFYFTSKD 
DSTLVAFVVG GKWEPIRGSC FIGSHCDALS VKINPGGSIR KGAEDYSLLG VAPYSGSLNE 
LWLNRDLGLA GSLLVKDPAS GKLARKLINS APHPIGFIPQ LAPHFGIEKK YNKQTEMVPI 
VAYSSDKDLV PTDEEKSSHL YSKYPLSLLR YITTLSGYSL SSIVQMDLDL VDVQPAARGG 
LGREFIYSSS LDDRLCSFDS VYGLIEFSQS FYGSEDINEY NGLSGIYLAN HEEIGSATRT 
GAAGGFLLDS LKSIVGSRYR TNNAERLLEL TNNSVLLSTD VTHALNPNFK DVYLDKNFPL 
PNTGPSIKFD SNGHVLSDSF AYQFLSSIIQ KHVPEIKLQH FHIRNDSRSG GTIGPIMSNA 
SRGLNGAKLI IDVGLPILSM HSIRSIMGYK DAGIGVRFFK QVLSNWQDEV AHLDI