Gene PICST_37167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_37167
Symbol	YMC3
ID	4840865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	+
Start bp	356579
End bp	357739
Gene Length	1161 bp
Protein Length	386 aa
Translation table	12
GC content	42%
IMG OID	640392180
Product	mitochondrial carrier protein
Protein accession	XP_001386462
Protein GI	150866760
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.787045
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.905393
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGCA ACCAAACTGT TTCACTTTCA GCCGCTGGTA TGAGAGCTCT TATGTACCAG 
CTTCAGTCTC TCTACCTAAG AACACCAGTG AAGTTATTTC GTCCTCTGCG ATTTGACTAT 
CTAGCCTATG TACGTGAGTT GGCTAACAAA CACGATAACA TCCACGAGAA ACCGTATAAA 
TTCAGAACGC ATTCCTCGAT AGGAATGCTT GTCAATGTAG TAAAGAAAGA GGGATGGAGA 
TTTATCCCTG ATCAGGTGTT GCCTCCTCTT GTAGCCAATT CGGCCACAGG GTTGATATTG 
TACGGAACTT ACTTGACGGC TTTGGATCGA TTCAACAGTC TGCATACCCC AAAAGCAGAT 
AAACCCCGAG AATTGTTCTA TTACTCCCCA TTCGATACAT GGAGAGCTGG TTTTATTGCT 
GGTGCCGTTC AGTCACTCGC AGCAGCACCT GTAGACGCCA TATATACTAG ACTGACAGCA 
GCAGAAATGT TGAGTGGTTC ACACCAAAAC CTCTGGATGT ACGGTTTGAA CAAACTTAAA 
GAAGTCGGAT TGGTTGGAGT TTTTGCTGGG TATAGTTTTT CGCTTGTAAA AGAATCGCTT 
GGATTTGCCT TCTACTTCTC TACCTTTGAG TTCGTCAAGA CTCAAGGCTA TACAGCAACT 
TTCAAGGTTG TCAATGTTTA TAGACGAAGC AAAGAATCCA TCAAAAGCAA GTTACGACAA 
TACTCAAATA TGAACGAAGA ACAGATAGAC GAACGACTAT TGAGCTTGGA GCGTACGAGA 
ACCAAAAAGA TATTGAGGTC AACCTTTATT CTCGTAGCTG GTGCATCTGC CGCTTTCTCG 
TTGTTGGCAA TACAATACCC AATCACCAAG ATTCAGAAGA TTCATCTTTC TAGACTTGAA 
GCTCTTGATT TCTACAATGC ATCAGCTACG CGTTCATACA AACCCTCCAT AACCTTGTAC 
TACAACTCAT ACATTGATAC ATATAACCAA ATCCTTAGGA TGAAGACAAA ATCAAAGTTG 
ACTTGGTATC AAATGGCATA CAAAGGTTTT GTCCGCAATG CATTGACAAC AATACCGGCT 
ACATCCGTGG CCCTCTTGGT TTTTGAAATA ATGAGAACCA GATTGACTGA CGACTTACTG 
GAATTCGAAA TTTTGGAATA G

Protein sequence

MSSNQTVSLS AAGMRALMYQ LQSLYLRTPV KLFRPSRFDY LAYVRELANK HDNIHEKPYK 
FRTHSSIGML VNVVKKEGWR FIPDQVLPPL VANSATGLIL YGTYLTALDR FNSSHTPKAD 
KPRELFYYSP FDTWRAGFIA GAVQSLAAAP VDAIYTRSTA AEMLSGSHQN LWMYGLNKLK 
EVGLVGVFAG YSFSLVKESL GFAFYFSTFE FVKTQGYTAT FKVVNVYRRS KESIKSKLRQ 
YSNMNEEQID ERLLSLERTR TKKILRSTFI LVAGASAAFS LLAIQYPITK IQKIHLSRLE 
ALDFYNASAT RSYKPSITLY YNSYIDTYNQ ILRMKTKSKL TWYQMAYKGF VRNALTTIPA 
TSVALLVFEI MRTRLTDDLS EFEILE