Gene PICST_50402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_50402
Symbol
ID	4840963
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	-
Start bp	709915
End bp	711309
Gene Length	1395 bp
Protein Length	448 aa
Translation table	12
GC content	43%
IMG OID	640392278
Product	predicted protein
Protein accession	XP_001386728
Protein GI	150866955
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGAGA ACAACCCCGT CAAGTATCTT GCGGACTCAG ATACTGAGTG CCAGAGATGC 
AAGGCAGTAC CTGCTGTGCT CATCACTAGA AAGGAAGCCT TCTGCAAGAA CTGCTTTATT 
CGTTTCATCA GGGGAAAACA GAGAAAACTG ATGATCGACG AACGTTATAA GGTAAAATAC 
GGTGCTGTTC AAGAGAAGAT TGGTCAACAG AAAGTTTTGT TGGCTCTTTC GGGTGGAGTC 
TCTTCTCTTG TTCTCACAGA TGTAGTAGCT TCATTATTAC AAGAACAAAT AGAAAGTCAC 
AAGGGAAGAA TGGGATTTGA GCTTGTGCTT TTGAATATCG ATGAATTCGA GTTGGAGTCA 
CTTAACAAGC GCATAGAGGA GATCTTGCCC ATTTTGGTGG AAAGATATGC CCCAGTCAAT 
ATACAATACA AAGTACTTTC CATAGAGTCT TTCTTGATAG ACCGGGCCAT GATTCAGAAA 
GTACTACTCA ATAAAGATTT CACTGCTATT GCTCAAAGAT TATCTGACGA ACAAAACAAG 
TACACCGTTG CTGACATGCT CAAGTTGTGT CCCAACAAAT CTTCCATGGA AGACTTACTC 
ACCGTGATCT ACGAAGAGCT CATACTCAGA ACAGCATTTA TAGAGAACTG TGAAACCATA 
ATATATGGTC ACAGCATGAC CCGCATAGCG AATGAGATCT TAGCATTAAC GGTCAGGGGA 
AGAGGTTCCT CGGTCTACAA AGCCATAGCT GACCACACAG TTCAATTTAT GGATAAAGAA 
TTCACCATCT TGTTCCCATT AAGAGACGTT CTCTTCGCCG AGATAATAGC ATATGCCGAC 
TTGATCGAAT TAAACAAACT CGAGGTCAAA AGCACCATCG TCAAGTCTAA GATCACTAAG 
AACTTAACCA TTAGAGATTT GACTACAAAC TACTTCAGCC ACTTGGACGC GACTGGATAC 
GCTTCTACCG CTTCGACTGT GGTCAAAACA GGCGAGAAGC TTGGAGCTCC GCAGTTCAAG 
CATTCTTATG GTCGCTGCCA GATCTGCGGA GTAGAAATCT ACCAAGATCC AAAGGAATGG 
CTCAGACGTA TCACTGTCAA TGATGCAGCA CCTATAGAGA CAGAAGAAGA ACAGGAATAC 
GTCAACCTCT ACAAAGAAGC CTTGAGCTCT TCTGAAACAT TAGACACCGA AAACACCCAT 
CCTGTCAATA TTTGTTATGG ATGCATCGTA ACCTTGAGTG GAGCAAAACA GGATACTGCA 
TTTGTATGGC CGTTGAAAGA CAAAGACACC AACGTGACCA GCCACTTTGC TGATGGTCAT 
GTCTATAAGT TTGACGAAAA GCACGAAGAC AAGAAAGTAC TTGACGAGTA CATACTCACC 
GACGATGAAG AGTAG

Protein sequence

MSENNPVKYL ADSDTECQRC KAVPAVLITR KEAFCKNCFI RFIRGKQRKS MIDERYKVKY 
GAVQEKIGQQ KVLLALSGGV SSLVLTDVVA SLLQEQIESH KGRMGFELVL LNIDEFELES 
LNKRIEEILP ILVERYAPVN IQYKVLSIES FLIDRAMIQK VLLNKDFTAI AQRLSDEQNK 
YTVADMLKLC PNKSSMEDLL TVIYEELILR TAFIENCETI IYGHSMTRIA NEILALTVRG 
RGSSVYKAIA DHTVQFMDKE FTILFPLRDV LFAEIIAYAD LIELNKLEVK STIVKSKITK 
NLTIRDLTTN YFSHLDATGY ASTASTVVKT GEKLGAPQFK HSYGRCQICG VEIYQDPKEW 
LRRITVNDAA PIETEEEQEY VNLYKEALSS SETLDTENTH PVNICYGCIV TLSGAKQDTA 
FVWPLKDKDT NHEDKKVLDE YILTDDEE