Gene PICST_33945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33945
Symbol
ID	4840849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	+
Start bp	841990
End bp	843219
Gene Length	1230 bp
Protein Length	409 aa
Translation table	12
GC content	43%
IMG OID	640392164
Product	predicted protein
Protein accession	XP_001386575
Protein GI	126140106
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3064] Membrane protein involved in colicin uptake
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.913132
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGCCA TTAATCCATA CTTCCAGGCT AGCCAACAAG GTTCAACCTA CGACTTCGAT 
TCTTTGATCA ACTACTTGAA TAATGTCCAG AGACAACAAT TCCACGAGCA GTCCAAGCCA 
AAGATAGTGA AAAAGATAGA AACGGAAGAT GAATACCAAA TCCAAGTCTA CAAGAAGACT 
GGAGACTTTA ACAACTACGA AGTCAGGGCC ATCAAAGTTC CAAAGCAATT CTCCCAACAA 
CCTCAACTCA TTAACGTCAT CTTGCAATCG GCCAAGGATA GTTTCAAAAA GACATTCCAG 
TTCAAGGAAC AAGATATCAA CGTTGAGGAC ATCAACTGGG AATGGTACAA GCAAGAAAAC 
ATCTTGGTGT TGAACGTCCC CAAGAAGGTT CATGTCTGCC ACTCCAACAG TTTCGAGGAC 
TTGGCATCAA TGCTCGGATT CCCATTTGGT GCATTTGGAT TGCAACAGCA GACACAAAAG 
AAGCCAACAC CAGTTGCTAT GGAAAGGTCC AGGTCAGAGC AAGCAAGATT GCAGGCTGAA 
GCAGAGGAAA TTGCAAGAAA AGAAGCCGAA GAACAGTTGA GGCAACAACA AGAAGAAGAA 
AGAAAAGCTG CCATTTCTAG AAGAGAGGCT GAAGAAAGAA AAGCAGCTGA GGCTTTGGCA 
AGAGCTGAAG TCGAAAGGGC CAGAATAGAA GCAGAAGAGA GAGCTCAAAG AGAAGCAAAA 
GAGAAGGCTA GAAGGGAAGC CCAAGAAAAA GAAAGAAGAG AAGCCCAAGA AAAGGCAAGA 
AGAGAAGCCC AAGAAAAAGC TAGAAAGATT GCTGAAGCAA AGATTGCTGA ATCAAAGGCT 
GCTGAAGCTA AGAGAAAGAC TGCAGAACAG GAAAGAATCA AGCAACAGAG AGAAGCTTAT 
GAAAACATGC TCAGACAACA ACAAGAATTC ATGAATAACT TCTTTGGTCC TTACTTGTCG 
CACAATTTCG GAACAGGATC AGTACCAGTA TCTCCACCAA CATCAAGGCC CACTTCAACA 
CAAGCTACTT CGGAAAAGAC TGAATCCCCT GCTAAGGCTA ACTACGATTC TGACAGTGAA 
TCAATAACAT CTGAGCCGGA AACTTCCTCT GAAAAGTCAC ATCCAAAGGA ATCTGAAGAA 
ATGCACAGAT TGCATAAGCA TCCATCTTTA GAGGAAGTTG ATGATGAAGA GTTCGTGTTG 
TTCAACAAAA AGTTCGGAGA CCAGAAGTGA

Protein sequence

MFAINPYFQA SQQGSTYDFD SLINYLNNVQ RQQFHEQSKP KIVKKIETED EYQIQVYKKT 
GDFNNYEVRA IKVPKQFSQQ PQLINVILQS AKDSFKKTFQ FKEQDINVED INWEWYKQEN 
ILVLNVPKKV HVCHSNSFED LASMLGFPFG AFGLQQQTQK KPTPVAMERS RSEQARLQAE 
AEEIARKEAE EQLRQQQEEE RKAAISRREA EERKAAEALA RAEVERARIE AEERAQREAK 
EKARREAQEK ERREAQEKAR REAQEKARKI AEAKIAESKA AEAKRKTAEQ ERIKQQREAY 
ENMLRQQQEF MNNFFGPYLS HNFGTGSVPV SPPTSRPTST QATSEKTESP AKANYDSDSE 
SITSEPETSS EKSHPKESEE MHRLHKHPSL EEVDDEEFVL FNKKFGDQK