Gene PICST_46961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_46961
Symbol
ID	4839104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	+
Start bp	628569
End bp	629585
Gene Length	1017 bp
Protein Length	338 aa
Translation table	12
GC content	38%
IMG OID	640390419
Product	predicted protein
Protein accession	XP_001384787
Protein GI	126136527
COG category	[R] General function prediction only
COG ID	[COG1310] Predicted metal-dependent protease of the PAD1/JAB1 superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGCAC CAACAGCAAG TGAATTAACA TTCTTGAGTA AAACCGTTTC TGTTTCACCA 
TTGGTGTTAT TATCAGTTGT CGATCACTTT AACAGAGTTG CCAAAGACTC GAAGAAAAGA 
GTAGTTGGCG TTATTTTAGG CGACAACTCC ACTGATTTGA TCAAAGTCAC AAATTCATAC 
GCCATTCCCT TTGAAGAGGA CGAGAAAAAC CCCAGTGTTT GGTTCTTGGA CCAGAATTTT 
ATAGACTCCA TGGGCGATAT GTTCAAAAAG ATTAATGCAA AGGAAAAATT AATCGGTTGG 
TATCACTCTG GTCCCAAGCT AAGACCATCA GACTTGAAAA TTAATGATGT GTTCAAGAAA 
TATACTTCAA ATCCATTACT ACTTATCGTG GATGTACAGC CAAGAGAAGT AGGTATTCCT 
ACTGATGCTT ACTTCGCAGT AGATGATATT AAGAACGATG GTTCCGCTGC TGAAAAGACA 
TTTGTTCATG TTCCATCGCT TATTGAAGCA GAAGAGGCTG AAGAAATTGG TGTTGAACAC 
TTATTGAGAG ACATCAGAGA TCAAGCGGCA GGAAACTTGT CCTTGAGAGT TACACAGACA 
TATCAATCCT TGTTGGGATT GCACCAAAAG CTTAAAGAAA TTGCCAATTA CTTGGACAAA 
GTCTACCAAA AAAAGCTCCC TATAAATCAT ACCATTTTGG GAAAATTGCA GAACGTGTTC 
AACTTACTAC CAAACCTATC TAATTCCAAC TTGGTTGGAG GCGAAGGCGT TGTAGATTCA 
CAAACACCAA GCCAATCAAG TAATCCTTTG TCGGCAGCAT TTACGATTAA GACGAATGAC 
GAGTTAATGA TCGTCTATAT AAGTACACTT GTCAGAGCAA TCATTGCTTT CCATGATTTG 
ATTGAGAATA AGCTTGAAAA CAAGAAGCTT AACGAAAAGA AATCGTCCTC TGAACTTGAA 
ACTGGCGTTA TTTCTCTCTT AAGTAATGAA GAAAAGGGTG AAAGTACACA AGAATAG

Protein sequence

MSAPTASELT FLSKTVSVSP LVLLSVVDHF NRVAKDSKKR VVGVILGDNS TDLIKVTNSY 
AIPFEEDEKN PSVWFLDQNF IDSMGDMFKK INAKEKLIGW YHSGPKLRPS DLKINDVFKK 
YTSNPLLLIV DVQPREVGIP TDAYFAVDDI KNDGSAAEKT FVHVPSLIEA EEAEEIGVEH 
LLRDIRDQAA GNLSLRVTQT YQSLLGLHQK LKEIANYLDK VYQKKLPINH TILGKLQNVF 
NLLPNLSNSN LVGGEGVVDS QTPSQSSNPL SAAFTIKTND ELMIVYISTL VRAIIAFHDL 
IENKLENKKL NEKKSSSELE TGVISLLSNE EKGESTQE