Gene PICST_32879 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_32879
Symbol
ID	4840061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	-
Start bp	852198
End bp	854054
Gene Length	1857 bp
Protein Length	618 aa
Translation table	12
GC content	40%
IMG OID	640391376
Product	predicted protein
Protein accession	XP_001385862
Protein GI	150866313
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.134484
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00551311
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGACAATA TTACAGATAC CATAGCAGCT CCCTCGTTGG AGAATATCAC CTTTGCGTTT 
AGCAACTTGT CCTATATCGA TCAGCTTGCT TACATCATTC CCCACAAGAT ATATTTGAAG 
GACTCGCCAA TCATTCCTGA AGTGATCAAT GGAGCTCTAA TTTTGCTTGT TAGTATAGCG 
ATCGTAATAG TAGGATCGTA TTCTACAGTA TCACGACCTT CGAACAGCGA AGACCCTCGT 
TTGGACAGAA AATCTCCGTA CTGGGATCCA TCGGATGTGG ATAACACCGA ACACTTTGTA 
GCCAACAAAA TGCAATTGTA CACATTGGGA GGCCAGAACT TGGGTTTAGT ACATGTATTG 
CTTATGCCTC TATCCACAGC AGGAACGCTA TACTTCTTGA ACTATGTCAT GAACAACTGG 
AATATCGACG ATATCAACTT GTGGTTGAAC AGATACATTT TAGCAGTGCT GTTGTTCTCC 
ATATACGGTA GTTTGGAATA CGTTCTTGTT GCTTCTTCAA GAAAATTGTC CAAGCTTCTT 
GGTGGACCCC TTAGCAATTC TAGCAATCTT TTCTGCAGAT ACCGTTTGAC ATTGACTGCC 
GACAAGGACG ACAACTTTCC ATTGGGCAGA TTGGAGAACT TTGATGAAGA CGAATTCGTA 
GAGAAGGAAT TGAAGAAAGA TCCAAAATGG AATGAAGCCT TTCAAAAGTA TTTGAGCGAG 
GAGAAGATCG AAATTTTGCG TCCTACTTCA GTGAGAATAA TTCCTAAAGT AACTGAAAAT 
ACCAATTGGA TCTTTGACTT GAAACCAGCA GTAATCCTTC CTTTAACAAT TGGCCTAATT 
TACCTGTTCT ACAAATACAA CCCAATATTG AATTCTGAAT ATAACATGAA TGATATCAAC 
TGGTTAGTTC TTGATTCCAT GGCTATTAAT TTTGCAATAT TTGGTATTCA AAAGATCAAA 
TTTGGTCAAT TCAAGTATGG GTTCCTTTTG TTGTCTGGTC TTTTCTTCTA TGACATTTAC 
TTTGTCTTTG GAACAGAGAT AATGGAAAAG GTTGCCACAG GATTGAATAT ACCAATGAAG 
ATATTGCTTC CTCATCCAGG TAGCAGCTGG GGCGAGCCAT TGAAGTTCAG TTTGCTTGGA 
TTGGGAGATA TCATTGTCCC AGGTACGGTT GCCTCTTTAT CGTTAAGATT TGACGTCTAC 
CGTCACCACC AGAAGAATCC ATCTACAGCA TTCCACTACT TGACTCCAAT CGCAAAGCCT 
TATTTTACTG CAGCAATTGT CTCTTATTTC ATTGGTCTTG CAGCTACGCT TGTTATGCTC 
AATATTTTCC GCGTAGGCCA GCCAGCTTTG CTATATATAG TTCCTTCTCT TTTGGGAGGA 
ATAACAATCA CTGGTCTTGC AAGAAGAGAA TTCACTGAAT TATGGGAATT TAAAGACGAG 
ATCAAGCAGT TTGACGAGAA GGACTTCGAA AATGAAAATG AAAACTACAT AGAAGAGGAG 
GATGAAGATT ACATTTTGAA CGAAGACGAA GCCTCATTTG ATGACTGGGT TGACCAAGTT 
GAATTGGAGA GGGCCGGATC AGAAGATGAA ACTGATTTGG ATGAATTCAG AAAGTTTGCA 
CCCAAAAGAT ACACAGCAGA AGATTTCGGC CCGGACGATG AAGAGGAAGA CGACGATACA 
TTTGTGATTG GAGAAGGCAG CGACGACGAA CTTGACGACG ATGACGATAT CGAAGAAGAA 
GAAGTCGAAT ACGAGGAAGA TGACGACGAA GCTGTAATCG AGGTTCTCGA GGAATTGCAA 
GTTATTAGAG AGGATTTGAA CAGACAGCCA CAAAGATGGT ACAGTGACGA AGAGTAA

Protein sequence

MDNITDTIAA PSLENITFAF SNLSYIDQLA YIIPHKIYLK DSPIIPEVIN GALILLVSIA 
IVIVGSYSTV SRPSNSEDPR LDRKSPYWDP SDVDNTEHFV ANKMQLYTLG GQNLGLVHVL 
LMPLSTAGTL YFLNYVMNNW NIDDINLWLN RYILAVSLFS IYGSLEYVLV ASSRKLSKLL 
GGPLSNSSNL FCRYRLTLTA DKDDNFPLGR LENFDEDEFV EKELKKDPKW NEAFQKYLSE 
EKIEILRPTS VRIIPKVTEN TNWIFDLKPA VILPLTIGLI YSFYKYNPIL NSEYNMNDIN 
WLVLDSMAIN FAIFGIQKIK FGQFKYGFLL LSGLFFYDIY FVFGTEIMEK VATGLNIPMK 
ILLPHPGSSW GEPLKFSLLG LGDIIVPGTV ASLSLRFDVY RHHQKNPSTA FHYLTPIAKP 
YFTAAIVSYF IGLAATLVML NIFRVGQPAL LYIVPSLLGG ITITGLARRE FTELWEFKDE 
IKQFDEKDFE NENENYIEEE DEDYILNEDE ASFDDWVDQV ELERAGSEDE TDLDEFRKFA 
PKRYTAEDFG PDDEEEDDDT FVIGEGSDDE LDDDDDIEEE EVEYEEDDDE AVIEVLEELQ 
VIREDLNRQP QRWYSDEE