Gene PICST_31436 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31436
Symbol
ID	4838548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	801898
End bp	803037
Gene Length	1140 bp
Protein Length	379 aa
Translation table	12
GC content	41%
IMG OID	640389863
Product	predicted protein
Protein accession	XP_001384452
Protein GI	150865298
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.120567
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAATCT CCAAGATAAC CAGCCCAGAC GATTGGTCGT ACTTCGCGAA GGGCGCAGCC 
AACATCCTCT TCAAATACAA CGGGCCCAAC GACTACTTGA GACACAAACT ACTTAGAGTA 
AGACTTCTCA AACAGGAAGA CCAGTACATT TCCACCTGCG AGCTCTACGA CTTCATCGAG 
CTCAAATGCA AGCACCTATT TCCACAGCAG ATCATTGACA TTCAGCTTAT AGTGCTAACC 
ACAGACTTTG TCAACCAATT GGACTCCAAA GGAAACCAGT TGATGCTAAA AGAAAGATAT 
GGCTTGCTTA TTCCGAACAT ACTTGACGGA GACTATGAGA AACAGGTCCT ACTGAAAAAT 
TGCACTTTGT ACTACGATTC AAATTCAAGT ACAACAAATA TCAGCACGAA TTCAGATACA 
AACAAGATCG ACTCTGTGAT CTTCGAAATA AAACCCAAAT GGCTCTATGA CAACGTTTCG 
TCCAACTACT GCCGAACATG CCTGTATAAC CAGCTTCGGC AATACCCGAG ACACTACTGT 
CCATTAGATT TCTTGTACAA ACGAACTATC GACACTGGCT TGGACGATTT GTTCAAACCA 
ATTGCTCCCA ATATTCTCGA GAATATCGAG AATTCCAACA AAATCCCTTT AAAGAAGTTG 
TTCCGCAACT TTCTCAATAA TCCGGAAAAT GTGTTTCAAA AATTGAAACA GTACCAAAGA 
ATTAATTCCA AAAACGACCT CATCAAGAAC CTCTCTTCGC CGCTGGATGT GCTGCTGAAC 
CTCTCTTTGG TGATGACTTT ACGAGATGTT GGGCTCTTTA TTAAGTTTGA AAAATACAAC 
CCCAACAATA ACGTTCACAA TTCACAGAAC AACGTCAACA ACTTGATTGT ACTAGAAGAC 
GGCAAGTTCG TCGTTTCATG TAATATCTAC GACTTGGACT TGAAGTCGAA GTTGAAGTAC 
AAACACTGGT TGGACGTTGA ACTGAAGCTC CAGGGCATTT ATAACTCCTC TAATGATGAT 
TGGAAGTACT GCGTAAGTTA TAATGAAGCC ACAGACGCAG ACTTCAGCAG AGACTTGGCT 
AACGAAACTG TCGATCCTAG TTCAAACAAT GAAGAAATGG AAGTAGACAT AGGAATATGA

Protein sequence

MEISKITSPD DWSYFAKGAA NILFKYNGPN DYLRHKLLRV RLLKQEDQYI STCELYDFIE 
LKCKHLFPQQ IIDIQLIVLT TDFVNQLDSK GNQLMLKERY GLLIPNILDG DYEKQVLSKN 
CTLYYDSNSS TTNISTNSDT NKIDSVIFEI KPKWLYDNVS SNYCRTCSYN QLRQYPRHYC 
PLDFLYKRTI DTGLDDLFKP IAPNILENIE NSNKIPLKKL FRNFLNNPEN VFQKLKQYQR 
INSKNDLIKN LSSPSDVSSN LSLVMTLRDV GLFIKFEKYN PNNNVHNSQN NVNNLIVLED 
GKFVVSCNIY DLDLKSKLKY KHWLDVESKL QGIYNSSNDD WKYCVSYNEA TDADFSRDLA 
NETVDPSSNN EEMEVDIGI