Gene PICST_33508 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33508
Symbol
ID	4840803
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009047
Strand	-
Start bp	824548
End bp	825924
Gene Length	1377 bp
Protein Length	458 aa
Translation table	12
GC content	46%
IMG OID	640392118
Product	predicted protein
Protein accession	XP_001386351
Protein GI	150866682
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTAACA CTACGTCTAT AGCCATGCCG CATGATCCCC AGCCTCCTAC AGCAGCTACT 
CCATCTACAA TTTCCACATC GCTGGCCATC GCTCCTCCTC ACACTGGACC TTCGGTGCTC 
CACTCTCGGA GCATTAAGCA CCAGTGGTCT GGAGCTGCGA GCTTGTTGAA TCCATTGCCC 
GCTGACGATG TTCGTAGTGG GTCTGAAACT GTAGAAACTG CTGTATCTGT AGTACAAGCT 
GATGCTCACA GCGCCGGATC GATAGAGGCT GTAGCTGCTG CACGCTCGCT AGAAGCACAA 
GAGGTTGCCC AAGCTGTTGA GTCTGTAGAT GCTGAAACAG TTGATATCAA CGGCGAAAGC 
TACGGTCCCG ACGAGCAAGA TTCTTCGTCG TCTTCACCTT CTAATTCTAC CAACTTCCTC 
TTGGGAGCGA AGAATGCCCA CCGCACAAAG TTGACCACAC ACGACATCAG ACTAATTCTA 
TACTTCATTG TCCAAATTAA ACCATTTAAG TATGTGGGTG ATCGCTCACT TTCCCAGACG 
AAGAAGTGGG AGTTGATTCA GCAGAAGTTT GCAAGCCACA AACATCTGGA TCATGAGAAG 
GATAGGAAAA ACGACGACTC GCCCGTAGTA GTTCCCACCG TAAGAACGCT TCAAAGACAG 
TTGGCTACTG CCATCCGTAA GGCTAGTATC AGACGTCACG AACGCAAGCA GGCTGGCATA 
ATTGACTCGA GCCCTAGCAG GTCTCAGGAT GACGAATACT ATTTGTTTAA GCATATTTCA 
GCAGACAGTT CGCTAACAGA ATTAGAAGCA GCATTACTTG ACCTCAATGA TCTTAGCGAT 
AAATTGAAGA CTGGCAAATT AGCGAACACC TCTCACCTCT TCCAGGGAAG CATGGATACA 
GAGGTGCAAC GAGGTGTCAC CAATTTGACA AGTATGACTT CGTCGTTGAG AGCCCTTATT 
GACTCTACTA ATTCCGCCAA TGGAGCGATT GATACTCGCC TAACTTCTAC GTTGCGGGAG 
TTGTCAGATA TCAAGGATGA CATTGGAGCT TTGTATGCCA ACGACAGATA CAGTTATTCT 
AGTATTTCTC AGTCTATGCA AGCATTTGAT GACTTCTTGG CTAAGTCAGC AGACTTCCAG 
AGTCAAGTAA TTAACGAAAA TCATTCCTTG TTCCTCGAGC TCGACAAGTT GATCAAGAAT 
CACTATGACA AGTTAGAGGC AATTAACAAA AACTATGCCG ACTACAGGGA CGAAGTGAGC 
GAAAAGATTG TATCGCTTCT CGCTGACAAA ATCCAACATT CCACGGAGGT TAAGAAAGAC 
GTCCAAGATC GTATCCTTTC CAAATTGACT TCGTTAAGGG ACACCGTAAG GAGGTGA

Protein sequence

MSNTTSIAMP HDPQPPTAAT PSTISTSSAI APPHTGPSVL HSRSIKHQWS GAASLLNPLP 
ADDVRSGSET VETAVSVVQA DAHSAGSIEA VAAARSLEAQ EVAQAVESVD AETVDINGES 
YGPDEQDSSS SSPSNSTNFL LGAKNAHRTK LTTHDIRLIL YFIVQIKPFK YVGDRSLSQT 
KKWELIQQKF ASHKHSDHEK DRKNDDSPVV VPTVRTLQRQ LATAIRKASI RRHERKQAGI 
IDSSPSRSQD DEYYLFKHIS ADSSLTELEA ALLDLNDLSD KLKTGKLANT SHLFQGSMDT 
EVQRGVTNLT SMTSSLRALI DSTNSANGAI DTRLTSTLRE LSDIKDDIGA LYANDRYSYS 
SISQSMQAFD DFLAKSADFQ SQVINENHSL FLELDKLIKN HYDKLEAINK NYADYRDEVS 
EKIVSLLADK IQHSTEVKKD VQDRILSKLT SLRDTVRR