Gene PICST_55665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_55665
Symbol	SHY1
ID	4837150
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	+
Start bp	1827902
End bp	1828981
Gene Length	1080 bp
Protein Length	359 aa
Translation table	12
GC content	43%
IMG OID	640388465
Product	mitochondrial protein involved in respiration
Protein accession	XP_001382576
Protein GI	150863927
COG category	[S] Function unknown
COG ID	[COG3346] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.585569
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCCAT TGAGGTTTTC CAGGAACTTT CATCTCAACA AAACGACTAT CAGAACCGTC 
AAGACATCCA CCGTGGACTG GAAACCGATT ATATCTACGA AGGGAAACTT GGCAACAATT 
GAGTATCAAT CTAAGATGCC CTTGTTGAGA AAATTCTTCC TCGGCTTGAT GATAGCTATG 
CCTGTTATTT CGTTTGTATT AGGCTGTTGG CAAGTTAAGA GACTTCAGTG GAAGACAGCT 
TTGATATCCA AATGTGAGAA CGCTTTGGCG CAACCACCCA TTGAAGAAAT TCCGGCCGAG 
CTCGATCCAG ATGCTATTGT AGACTTTGAG TACCGTAGAT TCAAATGTAA GGGACATTTT 
GACTACGATC AAGAGATATT CTTGGGTCCC AGAATCAGAG ATGGCCAGTT AGGATATTTG 
GTTATCACTC CGTTCGTCAG AACTTCTGGC GGAAAGCCTA TTTTGGTTGA AAGAGGCTGG 
ATTCACAAAG ATAAGGTAGT TCCAGAAACT AGAAAACATG GCTATTTGTC TCATTTGGCA 
TTTCCTCAGG GTGAAATCGA AATCGAAGCC TTGTTCAGAG TGATGCCAGT TAAGTCGTAC 
TTACAATTTG ACCACCAAGA TGGAGCCAGA CTCTTCAATG TTCATGATGT GCCGGAAATG 
GCCAAGCAGT CTGGCGCTTT ACCTATTTAT TGTCAGATGA TATATGATCT TAGAGACCAT 
GTGGACTGGA AGGGCCCCGA TGATGCCAAA AAACCTGCTA GCAAAAGTTC GTGGTTGAAG 
TCGCTTGCTT TTGCTCAGAA GCAAGAGCCA CAGGACGATG CCCATTTCAT CTCATCTCAG 
GCTGAATTCG ATCACACTTT GGAATACCAA GATTTTGAAT TCGTCAAGCA GGGTGTACCT 
ATTGCACCCA CACCCAAGTT GAAGTTCAGC AATAACCACT TGCAGTACCT TGTGACATGG 
TTTGGACTTT CAATTTGCAG CGCTGGACTT TTGATTTACA GTTTTATGAA GAAGGGAAGA 
TACCTGAGTG CTGAAAAAGT GATTGCTGAG AAGAGAAGAC AGATGGGAAG AACATTCTAA

Protein sequence

MVPLRFSRNF HLNKTTIRTV KTSTVDWKPI ISTKGNLATI EYQSKMPLLR KFFLGLMIAM 
PVISFVLGCW QVKRLQWKTA LISKCENALA QPPIEEIPAE LDPDAIVDFE YRRFKCKGHF 
DYDQEIFLGP RIRDGQLGYL VITPFVRTSG GKPILVERGW IHKDKVVPET RKHGYLSHLA 
FPQGEIEIEA LFRVMPVKSY LQFDHQDGAR LFNVHDVPEM AKQSGALPIY CQMIYDLRDH 
VDWKGPDDAK KPASKSSWLK SLAFAQKQEP QDDAHFISSQ AEFDHTLEYQ DFEFVKQGVP 
IAPTPKLKFS NNHLQYLVTW FGLSICSAGL LIYSFMKKGR YSSAEKVIAE KRRQMGRTF