Gene PICST_30665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_30665
Symbol
ID	4838142
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	630277
End bp	631377
Gene Length	1101 bp
Protein Length	366 aa
Translation table	12
GC content	38%
IMG OID	640389457
Product	predicted protein
Protein accession	XP_001383754
Protein GI	150864782
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.522798
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.228547
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAACT CCGTCTTGAC GAATGATGAA GTGCTATTTA AGACTAGAGA TCCTTTAAAC 
AATGCCAGAG CCATAGGAGT CAAGTATGGG TATGGTGATT CTGGGTCTAA TTTCCACGAT 
AAGGGATTAG CAATTTTACG TAAGGATACG GTGACGGGTG AAATTTCGTT CAATCCCATT 
AATTATGCAC ATAAGCTTAC ACTGAAGGTG TTTCGATACA TTCGTATCAA GATTCTTAGT 
GAGATCGATG GAGACTTCAT GCTTACTGGA CAGTCTTTGT TTGAAAACGA TTTCAGTAGC 
AGCAAAGATC AAATTATCAA CGACATCGAA AAAGCCCGAT TTTTTCTCTT TGAGGAAGAT 
TTGTTCTACC AGTTGACACG AGAAGCAAAG ACGTTGATCA ACTACAATGT TTCAATTATC 
TCTAACAAGA TCATTATAGA GATCAACAAT GAAATAATCG AGATTGAGTC TGTAGTTTAT 
GATGAGAACA ACGATGACGA GTTGAATAAC TACTACCAGA ACATCAACGC TTACTCTTCT 
ATCAATAATG GCAAGTGTCA ATTGATACTA AAGTTTTTCA AGATCATGTT GTGCTGTTAC 
TATAAATACA ACTTGAAGTT GAAGCAAAAG ATTCCCACGT CGTTGACGAA GTGGAAACAG 
CTGAATTCAC ATCCATTGGT ACTACGTCCA CTTCTCGGCA ATATCAGACA CGAGTTGAAC 
TTGAAAAACA TGCAGAGCAT TATCGACCGA TTGATAGCCA AGTTCAAGGA AAGTCTAGAG 
TGTAAATTGC AGGTAGACAA GTTTGCCAAT TTGGAACACA GATCAGAAAA CCCGTTCCAG 
AAATCGATCG AAAGACCAGT ATCGAAGTTT AATATCGTGT TGAAGAGTAA ACGTAGCGCC 
TACTTGAAGA TTGACTTGGA GTTGACCACC AACGAAATCT TTGTGAATCT CATCATCAAC 
ATGAACGTCA TCAAGTTCAA GTGCGAAGAT GATTTTAAGA ACAACTTTAA TGGAGTTAAT 
GTGCTACAGA TCAACTTCAA CGATTTCCAT GAGATTGAGG AATGCTTGGA TTGGACTTTG 
TTGAACTTTG TCAATGGATA A

Protein sequence

MINSVLTNDE VLFKTRDPLN NARAIGVKYG YGDSGSNFHD KGLAILRKDT VTGEISFNPI 
NYAHKLTSKV FRYIRIKILS EIDGDFMLTG QSLFENDFSS SKDQIINDIE KARFFLFEED 
LFYQLTREAK TLINYNVSII SNKIIIEINN EIIEIESVVY DENNDDELNN YYQNINAYSS 
INNGKCQLIL KFFKIMLCCY YKYNLKLKQK IPTSLTKWKQ SNSHPLVLRP LLGNIRHELN 
LKNMQSIIDR LIAKFKESLE CKLQVDKFAN LEHRSENPFQ KSIERPVSKF NIVLKSKRSA 
YLKIDLELTT NEIFVNLIIN MNVIKFKCED DFKNNFNGVN VLQINFNDFH EIEECLDWTL 
LNFVNG