Gene PICST_31848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31848
Symbol
ID	4839194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	-
Start bp	40089
End bp	41738
Gene Length	1650 bp
Protein Length	549 aa
Translation table	12
GC content	41%
IMG OID	640390509
Product	predicted protein
Protein accession	XP_001385030
Protein GI	150865703
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGAAT CGTCACAAAA AAGTAAGAGG ACACTAGGGA AACCTAACAG CGAAGAAATA 
ACACATCTCC CTCCTTCTCC TGTTAACGAG CAAGATGCAG CAATTCTCGA GCAACAGCCT 
TTGTTGGATC ATAATCATGA ATTTCTTGAT CCAGATGATC CCATAGTTTC TCCATTGAAC 
TTGTATAACG TTCAGTTAAT GAAAATTGGT GTTACGGTAC TAATATTTTT CAATGCAATT 
GTAGGATTTG CACTTATATT GACGGATTTC ATCTCAATTC CCGGACTTAA CAACCGAGGT 
AAGTCTTTTT TGGAGTTGGA CCTTATACTC GTGGCATTGC TAACTAATGC CATCACTCTT 
TGGTGCTTCA CGGTTCCAGT GTACTATGAC CGAATCCTAG GCTACATCAC TGGTGGGCTT 
CTTCTCTTAG ACTTGCTCGT GATTGGAGTA GTTACATACA CTAGACACCA ATTTGGCTGG 
ATAGGAATTA TTATTTTGAT CTGGACTGGA CTCAATGTTT TGGTGAATGC TCTTGTAGAC 
TACTGGGTAG AGAGGGAGAA ACGAGTACAG GAGGTAAGAT ACACTGGAAG AGTTGAGAAA 
AGATGGTCGT TGTCCGAGTT ATTGATTGCT TTAGTAAAAA TTACCGTCAA ATTATTCTTA 
CTATGGGTAG TCTGGTGTAT TAGTCTTACG TTTTGGTTGC AAACGTTTGA TTCACACGAG 
AAACCATGGG GAAAAATGGT TGCTGTGAAT GATAATTCTT TCAAAGTTCA CCTCGCTTGT 
TTTGGCAATG TTCATAATAA CACGAAATCT AGCCAACCTA TAATTCTAGT CGAGGGTGGA 
CAAATGATTG CTACAGAAGT CTTCCAAGAG TGGATTGAAG AACTATATCA CTTGAACAAA 
ATCGACCGAT ACTGTATTTG GGACAGACCA GGCTACGGAT TTTCGGATAG TGCACCTTCT 
CCGGTTTCAA TAGGAATCAT TACTGAGTAT CTTATTGAGG CTCTCAATAA GGAGGAAATT 
GAAGGTCCCT TTTCGTTGGT GGGTTTCGAC ATTGGAGGAC TATATTCGAG AGTGTTTGCT 
TCTAGAAACC CGAACAAAGT TCATTCGTTA CTTCTCGTAG ACAGTTGGCA CGAAGATTTG 
TTGAAAAGGT GGCCCTTTAG TGGATCCAAC CGAAAGAATG AGAAGTCTAC AGTTTTCAAG 
AATATTATTG AGCTAATGGA CAATATCACT GGATTTAAGC TTTGGTTTAG AGGCTTGGTC 
TCACCATTGG GGATTGTGTC TAATATCCAT TGGTTTTTGC ACCCATTCAA ACATCTGAGC 
AAAAGTCGAA TTTTCGGGTC CGACATGCGT TATCAACCGA AGTATATACG AGCTAGACTA 
CAAGAGCAGA TTACGTCTAC ATTATTGTCG TATTCTGAAG TCAAGGAGTC GACTGTGCAT 
GACCTTCCGT TGAGTGTGAT CTCATCTGGG TTTATGATCA AGAACTCATT GAACTGGGGC 
AAATGGCAGC AGGAGATTAG TAAGATCAGT TCGAACACTG TCGAGTGGGT CATTGCTGAA 
AACAGCAACC ACGAAATCTG GAAAAGTCCT CGAGGCAGAG AACAACTCCA GCAGTTACTT 
ATGCGTGTAA TAGGAGGGAA GACATACTGA

Protein sequence

MPESSQKSKR TLGKPNSEEI THLPPSPVNE QDAAILEQQP LLDHNHEFLD PDDPIVSPLN 
LYNVQLMKIG VTVLIFFNAI VGFALILTDF ISIPGLNNRG KSFLELDLIL VALLTNAITL 
WCFTVPVYYD RILGYITGGL LLLDLLVIGV VTYTRHQFGW IGIIILIWTG LNVLVNALVD 
YWVEREKRVQ EVRYTGRVEK RWSLSELLIA LVKITVKLFL LWVVWCISLT FWLQTFDSHE 
KPWGKMVAVN DNSFKVHLAC FGNVHNNTKS SQPIILVEGG QMIATEVFQE WIEELYHLNK 
IDRYCIWDRP GYGFSDSAPS PVSIGIITEY LIEALNKEEI EGPFSLVGFD IGGLYSRVFA 
SRNPNKVHSL LLVDSWHEDL LKRWPFSGSN RKNEKSTVFK NIIELMDNIT GFKLWFRGLV 
SPLGIVSNIH WFLHPFKHSS KSRIFGSDMR YQPKYIRARL QEQITSTLLS YSEVKESTVH 
DLPLSVISSG FMIKNSLNWG KWQQEISKIS SNTVEWVIAE NSNHEIWKSP RGREQLQQLL 
MRVIGGKTY