Gene PICST_43969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_43969
Symbol	ECM4
ID	4838219
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	306695
End bp	307663
Gene Length	969 bp
Protein Length	322 aa
Translation table	12
GC content	46%
IMG OID	640389534
Product	Extra Cellular Matrix protein
Protein accession	XP_001383688
Protein GI	150864731
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0435] Predicted glutathione S-transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGTTTG CTGCTAAAGA TGGAGCTTTC CACAGAAGAC CTTCGCTGTT CAGAGATTTT 
ATCAGCAACA AGCCTGGTTC CAAGTTCTTA GCCGAGGCTA ACCGTTACCA TTTATATGTT 
TCGTTTGCGT GTCCTTGGGC TCACAGGACG TTGATCACCA GAGTGTTGAA GGGCTTGAGT 
TCCGTGATCT CTGTGTCAGT AGTGCATTGG CATATGGATG ACAAGGGATG GAGATTCATC 
AACGATGAGG AATTGAAGAC AATTGACCCC AAGACAGATG TTTCTTTGGG AACAGTAGAC 
CATTTGTACA ACTTCAAGCG TATCAGGGAG TTGTACTTCA AGGCGGAGCC TGATTATGTT 
GGCAGATTCA CCGTTCCAGT CTTGTGGGAC AAAAAGTTGG AGACCATTGT GAACAACGAA 
TCGAGTGAAA TCATCCGGAT GTTAAACCTG GAGTTCAACG AGCTTGCCAC AAAGGAAGGA 
GCTGCCATTG ATATCTACCC TAAGGAGTTG CAAACAGAGA TTGACGACAT TAACTCGTGG 
ATCTACGACA ACATTAACAA TGGGGTGTAC AAGTCTGGGT TCTCCACCAA ACAGGAAGTG 
TATGACAAAG AAGTCAAAAA CGTGTTCACT CATTTGGACA AGGTTGAGGA GATCTTGAAG 
AAAAACCATG CGGCCGACAA GCCGTACTTG CTAGGTAACA CCTTGACCGA AGCAGACGTG 
CGTTTGTTCA CCACCATAAT CAGATTTGAC CCTGTGTATG TTCAGCACTT CAAGTGCAAC 
ATTGGTATGA TCAGACACGA TTATCCTCAC ATCCACCAGT GGGTCAGGGA ATTGTATTGG 
AAGGTGCCTG GCTTCAAGGA GACCACCGAC TTCGACCACA TCAAATACCA CTACACGAAG 
TCGCATATTG CCATCAATCC TCATTCAATC ACTCCAGCTG GTCCTATCCC CAACATCTTG 
CCATTGTAG

Protein sequence

LKFAAKDGAF HRRPSSFRDF ISNKPGSKFL AEANRYHLYV SFACPWAHRT LITRVLKGLS 
SVISVSVVHW HMDDKGWRFI NDEELKTIDP KTDVSLGTVD HLYNFKRIRE LYFKAEPDYV 
GRFTVPVLWD KKLETIVNNE SSEIIRMLNS EFNELATKEG AAIDIYPKEL QTEIDDINSW 
IYDNINNGVY KSGFSTKQEV YDKEVKNVFT HLDKVEEILK KNHAADKPYL LGNTLTEADV 
RLFTTIIRFD PVYVQHFKCN IGMIRHDYPH IHQWVRELYW KVPGFKETTD FDHIKYHYTK 
SHIAINPHSI TPAGPIPNIL PL