Gene PICST_36080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_36080
Symbol
ID	4838702
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	1575908
End bp	1577053
Gene Length	1146 bp
Protein Length	332 aa
Translation table	12
GC content	46%
IMG OID	640390017
Product	predicted protein
Protein accession	XP_001384607
Protein GI	150865404
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.494982
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATACG TAAAAGATCT CAGTGATATA CCGTTGAAAC CTCTCCAGGA GACTTTCGTC 
GACGACCCAA CCTCACTTGA AGAAATCTAC ATTGACGAAT TAATCTTCGA TCTTGAGCAC 
AAGCTCAAGA ACATCAACAA GCTCTCCATT TTCCATGCCA TCTATATCCT TTCTCAGCTG 
GTTCAAAACA TCATCAAGCT CCAGTCGGAT CCGGTTTTGT TCCAGCAGTT CAAGAATGAG 
CAGTTGGCCA AGTACAATAT CGACTTCTCC AGTAGTAGTT GTAGCAGCAG TAGTACAGTC 
ACTGACAGCC ACGAATCTGA CAGCCACGAA TTCACGCGTG TTTCGCTGCA TTCCTTGTTG 
CGGTCTCATA CGCCTCCGTT ATCGCCTCCA TTGAAGTTTG CCAAGTTGTC TCAGCCAATT 
TACCCTCAGT ATTCGTTTAA GGAATCGACA CCAGACTCTT TGGCTAATGA AGAAGTAACG 
CCAGACTCTA TTGAAGAACG TAAGGAATTG GAAGCTGAGT CTGAAGCCCA GCGAAGTCCT 
TTCACAGAGC AAGAAGATGA TGACGAGCAA GTAGAAGAAC CGAAGGAGCC TCCGTATATC 
CCCATCAAGC AGTTGGTGAA GGAACTCAAG CTTGACCCGG TTTCAGATCC TGTCACTAAC 
TTGAATCTCG ACAGCTTCAA GAAAGAAGTT CTATTCAACA GAGACTCTAA GCGTATCGAG 
CAGAATCAGC ACCTTCTCAA AATCTTCAAT CTTGTCAAGG TGCCACCTCT TACCATCGAT 
GAGTTCTTGC TCCGAATCAA GACGTACTCA TCTAGCATTT CGGTGCTGGC CTACATCCAC 
ACGGCATCAA TGATGTTCAA ACTCTGCATT CTTCTTGACA TCATCCCCCT CAGTCCGGTC 
AACGTGTACC GGTTCATTTT GGCTTCCTTG CGCTGCTCCA CTAAGAAGTT GGAGGATGTG 
TACCAAAAAC AGAAATCGTT TGCTACCGTC GGTGGAGTGT CCACACGGGA CTTGTACCGT 
TTGGAAGTGG GCTTTCTTTA TCTATGCAAC TTCAAGTTGG TTCTTGGTGA GGCAACGCTC 
AACAAGTTCT TGAACCAGGA CTTTGTCGAC TTGCACACCT TCGTCAAGGA AAACTACCAA 
AGCTAG

Protein sequence

MAYVKDLSDI PLKPLQETFV DDPTSLEEIY IDELIFDLEH KLKNINKLSI FHAIYILSQS 
VQNIIKLQSD PVLFQQFKNE QLANHEFTRV SSHSLLRSHT PPLSPPLKFA KLSQPIYPQY 
SFKESTPDSL ANEEVTPDSI EEQEPKEPPY IPIKQLVKEL KLDPVSDPVT NLNLDSFKKE 
VLFNRDSKRI EQNQHLLKIF NLVKVPPLTI DEFLLRIKTY SSSISVSAYI HTASMMFKLC 
ILLDIIPLSP VNVYRFILAS LRCSTKKLED VYQKQKSFAT VGGVSTRDLY RLEVGFLYLC 
NFKLVLGEAT LNKFLNQDFV DLHTFVKENY QS