Gene PICST_33809 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33809
Symbol
ID	4840812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	-
Start bp	533206
End bp	534525
Gene Length	1320 bp
Protein Length	439 aa
Translation table	12
GC content	44%
IMG OID	640392127
Product	predicted protein
Protein accession	XP_001386695
Protein GI	150866933
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0973496
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAGACC TGGAAAAGTT ACAGAATCAC TTCAGGGGCC ACGACGAGTT GAGTGAAATT 
CTTCACCAGG ACGAACTCCG CAAGAGTCTT ATCCGCTTGG CCGTGCTTCG TGTAGTCACG 
CTCAACAGAA ACAAGCCCAA GAGAGCAAAG ACCAACGAAC CCGATGAGCT TGTCCAAATG 
AAAAAACAGC TCAATGAATA CGAATTATAC ACAAACAAGT TGAAACAGGA GAGCCTGACC 
AAGTTGAAAT TGCAGGAGGC TAAACTTGAA AGTGCACAAG ACGAAGTGGC CAAACTCAAA 
CTACAGCTAG CAGCAGCCAA AGAAGCAGCC AAAGATACAT CTAAACCAAT GTTCAGTGTG 
CCTAGTTCAA GTTCGTTTAG ACCGCGAATC AACCTCAACG GGCTCTCAAG ACCGAAATCA 
GCAACATTAT CTTCTATCAA AAAGTTTCCA TTAGCCAGAC CTACGTCTGT GTCCAGTGAA 
AGAAACTATC TATCGCCCAC TTTCAACTCT ATTAACAAGT CAATATATTC GTCAGATGTT 
TCCACAGTTT TGACACCCAT ACTGAATAGG ACTATTAGTA AACCACGTGG AAAATACATC 
ACAGCCAGGA ATTTACACGA ATTGGGCAAT TCTCCAGTGA CGTCTAAGTT TGGAATTTCG 
AAGCCACCAA CAAAATTGAC GACACTAACC CAAAAAATAG AAGCACAGAA AGACGAAAAC 
GAGCCTCCAA AAACTGCAGA AGCAGAAACC GAAGCAGAGA TCGGAGCGAA ATCTGCTACT 
ACTTCTGTCT TACGAAGTTC ACCTGCAAAA ACTCCTTCAC GTAAATCTTT TATAGAGAAC 
TTCGACAAAT CATCAGGTTC AAGCTCGCCT TCTCCGGAAT TCACCCCAAT GAGGGTTTCT 
TCAGACAAAA CTTCGGCTCC AGTGTCACGA GACATTGAAG AGACCGGATT CGGCAACGGA 
AAAGTCACGA GAATCGAAAA ATTCGACAAT ACTTTACAGA CTGACGAGGA TACTTTTGCT 
AGTGCCAACT CGACACTTGT AGGAAATGTT TCAGGAGACG TATTGCCTGA AAAGAAGAAG 
ACGAAGAAGT TGCAATTGTG GAAATCAGGA GCTACTAAAG TGCCCTTAAC GGCTCCAGGA 
AAGAAACCGC ATAGTCTTGG GCTCGAAGAT GAGAATCTCA ACTCTTTGAA TTACTATGAA 
GATGGAAACT TTGCAACGGA CGAAAGTCCA CCCAAGCCGC AGCATAAGAG ACAATTAGAG 
TTGTCCCCCG TTCCAGAGCC TGCTAAGCGT CGGAAACATA ATACGTTCAG GATAGACTAA

Protein sequence

MIDSEKLQNH FRGHDELSEI LHQDELRKSL IRLAVLRVVT LNRNKPKRAK TNEPDELVQM 
KKQLNEYELY TNKLKQESST KLKLQEAKLE SAQDEVAKLK LQLAAAKEAA KDTSKPMFSV 
PSSSSFRPRI NLNGLSRPKS ATLSSIKKFP LARPTSVSSE RNYLSPTFNS INKSIYSSDV 
STVLTPISNR TISKPRGKYI TARNLHELGN SPVTSKFGIS KPPTKLTTLT QKIEAQKDEN 
EPPKTAEAET EAEIGAKSAT TSVLRSSPAK TPSRKSFIEN FDKSSGSSSP SPEFTPMRVS 
SDKTSAPVSR DIEETGFGNG KVTRIEKFDN TLQTDEDTFA SANSTLVGNV SGDVLPEKKK 
TKKLQLWKSG ATKVPLTAPG KKPHSLGLED ENLNSLNYYE DGNFATDESP PKPQHKRQLE 
LSPVPEPAKR RKHNTFRID