Gene PICST_33812 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33812
Symbol
ID	4840814
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	+
Start bp	538910
End bp	540269
Gene Length	1360 bp
Protein Length	354 aa
Translation table	12
GC content	39%
IMG OID	640392129
Product	predicted protein
Protein accession	XP_001386497
Protein GI	150866785
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.680191
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.108909
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATTGGC GAAAATTGGG CTTCAGTGCT GTAAGTAGTC ACACGAATGT TAATTGTGAT 
ACCTAATTTG CGAACATCAA AGAATATGAA ACTTTGAGCT TCATAACTTA ATACACTCAT 
ACTATAATAC TGGAGATACG ATATATCATA CAAGGCTGAA TGGTAGCACA GTACTAGTAC 
GATTCAATAC TGTTTTGATA GTAGATTCTC CCTTTATGCT GTGCTGTATT CCACTATGAA 
GTATCGTATG ATCTATATCG TTTCCATATT GTACACCTTC CGATGATGTT CTGTGATATC 
TTCCTCAATT ATACTAACAT ATCCAGTTTG GCACGTTTCT AGGCGTCTCA GTTTACAAAC 
GGCTAGAGAT TAAGAATAAC ATCTACATAC AATCACCCAT TAATTCCTAT GGAAGCATCC 
AGAGCTTGGC CAGCAAGGTG TTTTCAACGT CTACAAGCAC TTCGTCAAGG TCGTCCTTCA 
ACTTCAAGCT TTTCAATCTT GGAATCTTGG GATTGCTTCT CTTCATTAAC TTTGTCAAAT 
GGGCCATCTT TGGTAAACTT TCACCTACCG AAATCAGAAA TCTCAAACAC AAGATCAACT 
ATACCATCTG GGAGTTTGCC TTTGGATTCA TGATCTTCTA TGTAAAGTCA CGATCGATCG 
GATTGCAAGT AATTCAGAAC GAGTTGTTCA AATTTGCTGG CCTCTTCTTT TCTGTGCTTT 
TGCTTAAATG TTTTCATTAT CTTTCTATAG ACAGAGTCAG CTCCATCTTC AACACAAATT 
CCAACTCGCG GGCCGAGGTG AAGTATCAGG GACTAAGACT CTTCGTTGGG CTCATAATTT 
TGGCATTTAT TGACAACTTG TTGATCTCTC GTTTCTTGTA CGAAGTGTAT CAGAACTACT 
ACTGGTCAGA TAAAATGATC GAGATGTCGA AAGTAACACT CCAGGAAAAC ATTTTGACAG 
CTATCTTTGG ATTTGAGATC TTGCACATCG GGCCGTTAAT TTTCTTGACA ATCTTGAAGT 
ATTGCTTGGA TTTCTACGAA TATTTCCACT TCCATCTGGT GTGGCCCGAG GGCAATGCTC 
CACTTACTAC AGAATTGGAG TTGAATACCT GGAAAGAAAC AAAGATGAAG ATTATATATG 
TGACAGAGTT CGTAGTGAAT TTGTTACGTT TCACCATGCT CTGCATATTT TCCATCGTCT 
TTTTATCGCT TCACACTTTT CCCTTCCATA TCTTGCCATC TTCGTACTTG AGTTTGAGAG 
TTTTAGTGGT GAAAACAAGA CAGTTGATCA ACTTCAAAAA GAAGCAGTTC ACATTGAAGA 
AACTTACGAT TCCCGCTACA CTCGAAGACC ACCTGGAGCA

Protein sequence

MYWRKLGFSA FGTFLGVSVY KRLEIKNNIY IQSPINSYGS IQSLASKVFS TSTSTSSRSS 
FNFKLFNLGI LGLLLFINFV KWAIFGKLSP TEIRNLKHKI NYTIWEFAFG FMIFYVKSRS 
IGLQVIQNEL FKFAGLFFSV LLLKCFHYLS IDRVSSIFNT NSNSRAEVKY QGLRLFVGLI 
ILAFIDNLLI SRFLYEVYQN YYWSDKMIEM SKVTLQENIL TAIFGFEILH IGPLIFLTIL 
KYCLDFYEYF HFHSVWPEGN APLTTELELN TWKETKMKII YVTEFVVNLL RFTMLCIFSI 
VFLSLHTFPF HILPSSYLSL RVLVVKTRQL INFKKKQFTL KKLTIPATLE DHSE