Gene PICST_31696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31696
Symbol	HMC3
ID	4838557
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	1458079
End bp	1459323
Gene Length	1245 bp
Protein Length	414 aa
Translation table	12
GC content	38%
IMG OID	640389872
Product	hypothetical protein
Protein accession	XP_001384579
Protein GI	150865386
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.772275
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.350827
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAATT TTTCCACAAA TGCTCTGTCG ACTGGTAGAT CGGAACTGCC AGAAGAACAG 
ACATTCAGTC CCATCACTGC AAGTCTTCTC GCAGAAGCGA TTAGGGAACA AGCAAATCAA 
TTGCTTGAGA AACAATCAGA CGAATTTGAG GCTAAATTTC TACTGCTTCA AAACCAAATT 
CATGATATCC TAACGCTTAT TTCTGCCGAG AAAAGTGGTA ACAGAAAAGG AGTTTCGAGA 
AATACTGACG ATTCTTCGAC CATTACGAGT ACTAATAGTG ATATTAATCT TATTCAATCT 
AGTATTGAGT CTAGTTCGGT GCTCGCTGAT GATGACTTAA GTGTAAACAT CAGTGCTCCA 
CCTAAAATTG AACACTCTCC ATCGTTTAAA TCAAGTAAAC ATTCTGCTGA AAAAACATTC 
AATTTATTTG AAAGAACTAA CGATACGATT CGAAAGTCTC AGAAACGCTT TCATGAATCT 
TGGAGAAAAT TACCCAAGCT CAATGATAGC AGCGTTGAAC TCTGGTCCAG GGCTCTTCAG 
GAACTAAACA GTGACCCAGA CTATAAAGCT TTGTCTAAGG CAAACTTCAA AGTAGACTGG 
AACAGTTTCG AATCCAGAAC TGGACTCCAT GGTAATGAAC TTAAATACTA CTACGATTGC 
TGGAAGGATG ATCTCATTGC ACCTTATTGC AATAATACTT TGAGTATTCT TGCTGCTACC 
CGAGATCATA CTGTCACCCT TGAAGATCTA ATTGAGTACA CATCGGAGCA TGCAGATGAT 
GCTAAAACGA TGTCTATACT TGAGGAAGTG CAACGACGCT ACCGAATCGA TATACTGTGT 
AAAGACTATG TCTCAGAATT GAGAGGCAAA AACACGCATG ATTATGACCG TATAATTCAA 
TTTATTGACG GTATTCCTTC CGACCTATAT GGCACCATTA GTCACTACTG TAACCAAAGA 
CACGATGGCA ATTGTATAAT AGCTGCCGCT ACGGCCAATT TCTATTATAA AGAATTTATG 
ACCAAGGAGA ATTTTCATTA CCCTACCCCC AACACTTTCC AAAAGAAAAT GATCAGTACA 
CCTGGTTTCT CTGGTAAAGT TTTATCTGAT TCCTCTAAAT CAAGAACGAA TTCCAAACAC 
AGAAAAGACA GGAGTAACTA TAATAATTAT TCTCAAAATA AACTGCTGTT GGAGAATAAC 
CAGAAATCGC ACAGAAGACA AACGGACAAT GTTAATCACA ACTAA

Protein sequence

MSNFSTNASS TGRSESPEEQ TFSPITASLL AEAIREQANQ LLEKQSDEFE AKFLSLQNQI 
HDILTLISAE KSGNRKGVSR NTDDSSTITS TNSDINLIQS SIESSSVLAD DDLSVNISAP 
PKIEHSPSFK SSKHSAEKTF NLFERTNDTI RKSQKRFHES WRKLPKLNDS SVELWSRALQ 
ELNSDPDYKA LSKANFKVDW NSFESRTGLH GNELKYYYDC WKDDLIAPYC NNTLSILAAT 
RDHTVTLEDL IEYTSEHADD AKTMSILEEV QRRYRIDISC KDYVSELRGK NTHDYDRIIQ 
FIDGIPSDLY GTISHYCNQR HDGNCIIAAA TANFYYKEFM TKENFHYPTP NTFQKKMIST 
PGFSGKVLSD SSKSRTNSKH RKDRSNYNNY SQNKSSLENN QKSHRRQTDN VNHN