Gene PICST_29495 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_29495
Symbol
ID	4836850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	406979
End bp	408199
Gene Length	1221 bp
Protein Length	406 aa
Translation table	12
GC content	42%
IMG OID	640388165
Product	predicted protein
Protein accession	XP_001382839
Protein GI	126132628
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCCGA GACTCTGTCG CTTTTCTATA GGGCTCACGG GACGCTCTAT CGTATTAAAT 
AGATCTACGT CTGTTTTTCC CAAACACTTT CATTCCAATC CGGTGGTTTT ATCGTTTACC 
TCCAGTTCTG GCTTTGAATA TGTGGAAAGC TACAAGAGCT TGAACGATAA GATCGAAGCT 
GTTTTTGGGC AGAAGGACGT TTCTGACGAC GACATAATAG CAGCTCTTGT TGCCTGTCGT 
AATCTAGAGC GAAACTATCC AGTCAATCAA CAGTTGCACA CCAATTCCAG ACTCATCCAA 
GAAGCTTCCC ATTCTATAGA GCTAATCTTC AAGAACGACA CCAAGTTCTC AGCTGAATTG 
TTGAAGAAGA TCTTTCTCTT GAAGTTGGCT ACTCCGTTGA ACTTGAAGAT TATCAACACT 
TTCTACGAAA AGAATCCAGG AGCCAATACC ATTATCGATA AGAGTACTGC ACTTGTAGCT 
TTGAGAAATG CCTTGGCCAA TGCTGACTTC CTCAATGCCA TCAAGTTGAC CGATGTGACT 
GTAGGCCATC CCAATTATAT CGAGCACAAC AATAGGATCC TCAGGAAGGG TTTTTCACAG 
TTGGTGGGTA CATCTTTGGT AATAACGTTC TTGACCAAGT ATGGAGTTAA TGAAATCATC 
GATATGGGGG CTTTGAACGA AGGCTGGAAA CATTTGGGAG CCATTAACTC GTTGATTTTA 
ACCTATTTGT TCAACTCCAG TTTCTTCTTG ACAATTGTCA GAGTCGGGCG ACAGTTAATC 
AGCTCCGGTG GTGACTATTT GACCTGGCAA AAAGGAACAT TCTATACCCA TTGGTTCAAA 
CATGCTGATG AGATGTTATT TTCAGCCAAA ATTGTAGAAG CTGATCGTCA GTTGAATGGT 
GGAGAGTCAA ACCCTGAGAT CATCAACGAG TTATGTAGAA CCAGTGACGA TATGTTCAAT 
ACCCAACGTA CATTACAGCC CGGATATAAT CGTGAAGGTG AAAAGATCAG ATTGTTGGAA 
GCCAAAGACA ATATGGAAGA CCTCAAAATG CAAGCATATT GGATGAGTGG AGGTGATGGC 
TTCGAATGGG TTGAACCAGA TCAGGATCCT GCCGATTTGA TCTGGAAACA ACATCTCGAT 
AGTTTTAATA AACCTACTCT AGACAATAAT AGCAAGGCTA AGAACTTGAA ATGGGCTGAA 
GAGTTGATTG GGGACAAGTA G

Protein sequence

MLPRLCRFSI GLTGRSIVLN RSTSVFPKHF HSNPVVLSFT SSSGFEYVES YKSLNDKIEA 
VFGQKDVSDD DIIAALVACR NLERNYPVNQ QLHTNSRLIQ EASHSIELIF KNDTKFSAEL 
LKKIFLLKLA TPLNLKIINT FYEKNPGANT IIDKSTALVA LRNALANADF LNAIKLTDVT 
VGHPNYIEHN NRILRKGFSQ LVGTSLVITF LTKYGVNEII DMGALNEGWK HLGAINSLIL 
TYLFNSSFFL TIVRVGRQLI SSGGDYLTWQ KGTFYTHWFK HADEMLFSAK IVEADRQLNG 
GESNPEIINE LCRTSDDMFN TQRTLQPGYN REGEKIRLLE AKDNMEDLKM QAYWMSGGDG 
FEWVEPDQDP ADLIWKQHLD SFNKPTLDNN SKAKNLKWAE ELIGDK