Gene PICST_52783 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_52783
Symbol
ID	4851518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	2039891
End bp	2041126
Gene Length	1236 bp
Protein Length	411 aa
Translation table
GC content	45%
IMG OID	640393226
Product	predicted protein
Protein accession	XP_001387628
Protein GI	126274728
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.423874
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCTCAT CCTCTAGCAT CTCCAGACGA AACTTGTCTT TTTTCTGGAA GATGTTGGCT 
CTCGATAAAC CCGAGTCCAA GGAGTCCGAA CGTCCGCTCT ACAACTGGGA CGAATCACCT 
TACGAAGATA TTAGAACACG TGCAGCGTTC ATAAGAGCCA AAGCCCTCTG TCCGGTCACC 
AAGAAGCCAG TCAACTTCGT TTGTCCATAT TCAGGAATTC CTACTCACCA TTCGAGAGAA 
GCCTGGGAAA GCGATACTGA ATACCACAAG AGAAAAACCT ACGAGTTGTT GAAGAAGGTC 
AACTTGTACG AGCACGATGT CAGATCTGGT AGAAAATTCG ACGAATTTGT ATTTCCCCTC 
GAACAAAATA ATGATTACAT GGTCAACTTG TCTAGTTGGG ATTCGTTCTT CTACACGAGA 
GATTTCGCTC CCATGAACAC AGAATTCAAC TTGGCTGCTG CCACTAAAGT ATTGACATAT 
CCCATGACAA TTGCGGCTAT TATTAACAAA TATTCACCCT ACGAACCACA GCCTAAGGGA 
CCAGTAACTG TAGAAGGTCT TCGTTCCTTG GCAGCTTTGA AGTATACTTT ATATCCTCCA 
TACACTAAAT CCACTGACGC TGTCACTTTC AAAGAAAGAC CCATGAGAAT TTTCATTCTC 
GGCGCTAAAA TGGAATCCAT GTTGCCTGGT TACGTATGGA AACAGTTTGG TTATCTTTTC 
CCAGAAACCA AGTTCGAAAT CCATTTGGTA GGCCCGGAAG CTTATTTTGA TAAGGAGACC 
AGATCGTTCG GCCCTACAAA TGAGCCTCAT GGCCGTGCCC TAGTCAAAAG ATTTGACGAG 
CAAATCACTC TTCACTACCA TACGAGATAC TTCCACGAGC TCTACGACAT GGGTGACTTG 
TTCCCATTCG ACCCATACTT GGATATTTTC TTTTTGTTCC ATCCCGGGTT CGGCACGGCT 
GACTCCATTT ACTGGGACAA AGCCATGAAG GGATTGCTAG AGTCCAAATG TCCCATCTAC 
GTCAGTGGGT ACCACGACAA GGACATGAAG CGAGAAATAC AGTGGTTGGA AAATCACCCC 
TTGCACGACG AAATGGATGT GTTGATGACT CAAACAGACA ACAAGTTTGC CTGTACCAAG 
ATCGACTTGG TGGACATCAA CCCCACGGAA ACATTTAACT CCAATAGTCA ATTATATGCA 
TTCAGAGGTA AGAGATACCA CGCCATTAAG ACCTAA

Protein sequence

MGSSSSISRR NLSFFWKMLA LDKPESKESE RPLYNWDESP YEDIRTRAAF IRAKALCPVT 
KKPVNFVCPY SGIPTHHSRE AWESDTEYHK RKTYELLKKV NLYEHDVRSG RKFDEFVFPL 
EQNNDYMVNL SSWDSFFYTR DFAPMNTEFN LAAATKVLTY PMTIAAIINK YSPYEPQPKG 
PVTVEGLRSL AALKYTLYPP YTKSTDAVTF KERPMRIFIL GAKMESMLPG YVWKQFGYLF 
PETKFEIHLV GPEAYFDKET RSFGPTNEPH GRALVKRFDE QITLHYHTRY FHELYDMGDL 
FPFDPYLDIF FLFHPGFGTA DSIYWDKAMK GLLESKCPIY VSGYHDKDMK REIQWLENHP 
LHDEMDVLMT QTDNKFACTK IDLVDINPTE TFNSNSQLYA FRGKRYHAIK T