Gene PICST_37839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_37839
Symbol
ID	4851006
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	695196
End bp	696662
Gene Length	1467 bp
Protein Length	488 aa
Translation table
GC content	43%
IMG OID	640392714
Product	predicted protein
Protein accession	XP_001387771
Protein GI	126273967
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.350145
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.85819
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGGAAC TTGAAGGCGA CGACAAGGCA ATGGCTAGAA AGATTTACCT TGTTAACAAC 
GCCTTGGACG AGATAGGGTT CACCTGGTTC CATGTTAAAT GCTTTGTCGT TGCTGGCTAT 
GGTTATGTTG CAGATTCTCT CTTGGGTATG GCCCAGTCGA CTGTTGCAAC TTACGTGAAT 
TTGCAATTCA ACCAAACATA TCCCTTGAGC ACACAAGTTC TCTACATTGG CCTCTTTTCG 
GGATGTGTCT TCTGGGGGTT GAGTGGTGAT ATCATTGGAA GAAAGCTTGC TTTCAACTTG 
ACCCTATTCC TCTGTGCCAT CTTAAGTTTT CTTGTTGGTG CCATGAGCAG TTTCCCCATG 
TATTGTTTCA TGTTGGCGAT TAGTTCATTT GCTCTAGGCG GTAACTTAGC TATTGATGCT 
ACAGTGTTTT TGGAGTTCTT GCCATTCAAC TACCAGTGGT TGACGACTTT CTTTGCCTGT 
TGGTGGTCTC TTGGCCAAGC AGTTGGATAT GGTGTGGCTT ATGCCTTTGT TGTTCCAGAA 
AAGTGGCATT GCACCAGTGC CGATAACTGT CCCTCTGAAA GTAACAGAGG ATGGAGGTAT 
GTGTGGTATG TCGATGCAGG TATAGTATTC TTCTTTGCCG TTATCAGATT GATGCTCAAG 
TTAGAAGAAA CCCCAAAGTT CTTGGTAACC AACAACAGGG ATGCTGAATG TGTAGAGCAG 
TTGCAGGCAA TTGCTAAGAA GTACAACAGA ACTTGTTCCT TGACCTTAGA AGACTTGCAG 
GCTTGTGGTG AAGTAAAGAA AAATGACTTT AAGATGAGCG ACCCTAAGTT GAAGGACTTC 
TTCAGCAGTA GTATAAAAAA TAGTAAAGCA TTGTTCAGCA CTAAGAAGAT GAGCATTAAC 
ACCTTGATGT TATTCATGTC TTGGTTTGGT ATTGGTATCG CTTATCCACT TTGGGGTACT 
TTTTTGCCAG TTTACATTGC TTCTAAAGGT GGTCATACCT CTGCCGACGA CGCTGCTGGT 
GTTTATGGCG ATGCTTTGCT CTCCACTTGT TTGTCTTTCT TTGGTCCAGT AATTGGTGGT 
CTTCTCATTT TAATTCCTCG GGTAGGAAGA AGAGGTACTC TTTGTATTGG TGGTATAACT 
TCTATGATCT TTTTTATGGC TTATACGACA GTTAGAACAA GACCAGGTGC TCTCGGTTTC 
TCAACAGCAG CCTACATCTG CATCTATATC TACTACGGAT GTCTCTACGG TTACACACCA 
GAATGTCTTC CAAGTTACTG CAGAGCTACT GGCTCCGGGT TGGCATTTGT CTTCAACAGA 
ATAGCGGGCC TCATTGTCCC AGTGATTGCT TATTACGCTA AACCTACCAC TAGTGTACCA 
ATTTGGGTGT GTGCTTCTTT CATTGGTCTA ATTGGAATTG GCTCCTTGTT TTTTCCATTC 
GAGCCTTCAA GACAAAGATC TGTCTAA

Protein sequence

MLELEGDDKA MARKIYLVNN ALDEIGFTWF HVKCFVVAGY GYVADSLLGM AQSTVATYVN 
LQFNQTYPLS TQVLYIGLFS GCVFWGLSGD IIGRKLAFNL TLFLCAILSF LVGAMSSFPM 
YCFMLAISSF ALGGNLAIDA TVFLEFLPFN YQWLTTFFAC WWSLGQAVGY GVAYAFVVPE 
KWHCTSADNC PSESNRGWRY VWYVDAGIVF FFAVIRLMLK LEETPKFLVT NNRDAECVEQ 
LQAIAKKYNR TCSLTLEDLQ ACGEVKKNDF KMSDPKLKDF FSSSIKNSKA LFSTKKMSIN 
TLMLFMSWFG IGIAYPLWGT FLPVYIASKG GHTSADDAAG VYGDALLSTC LSFFGPVIGG 
LLILIPRVGR RGTLCIGGIT SMIFFMAYTT VRTRPGALGF STAAYICIYI YYGCLYGYTP 
ECLPSYCRAT GSGLAFVFNR IAGLIVPVIA YYAKPTTSVP IWVCASFIGL IGIGSLFFPF 
EPSRQRSV