Gene PICST_86063 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_86063
Symbol	HMX1
ID	4850975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	601200
End bp	602345
Gene Length	1146 bp
Protein Length	292 aa
Translation table
GC content	43%
IMG OID	640392683
Product	heme binding protein
Protein accession	XP_001387756
Protein GI	126273936
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG5398] Heme oxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.507414
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0416913
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CAGAAAACTG CCAATATCCG TTTGACATTT GACTTTTTTG TCTGTAATTT TCAAACATTA 
GCTAGCAGAA TTTTCCCCTG ATCGACTTTC CCATATCTCG ATCTTTTTCG CATCTTAAAT 
CGCATAGTAT CATAATGTCC AAGGTACAAA ACTCCGGCGC CACCACCAAG CTTTCTCAAC 
ACGAGATTCT TCCGGCCAAG AACGACATTG GCGCTCTTGC CAACAGAATC AACTCCGAAA 
CAAGATCTCT CCATGACAAA GTCGACAAGT TGGTCACCCT CAAGATGGCC CTCGCACTCA 
GAGACGGCAA GATCTACAGA CAGGGCTTGC AGAGTTTCTA CCATGTTTTT GCATCCATCG 
AAAAATCGCT CCACGCCCAG CTCGAGAAGG ACGACGAATG GACGCCAATG TTGAAGAGCG 
TGTGGAAGCC AGAAATTGCT AGACGTGAGA AGGCAGAACA AGACTTGTTG TTCTACTACG 
ATGACAGAAA GGAAAAGTTT GTCAACCCTA TCATGCCAGA GCAGATCGCA TTTGCCAATC 
ACATCTTGGA AGGCACTGCC GAAAAGCCAT ACTTGCTCTT TGCCTACTTG CATGTTATGT 
ACTTGGCCTT GTTTGCCGGT GGAAGAATCA TGAGATCGTC TTTCGCAAAG GCTACTGGCT 
TGTTCCCACA CAAGAACGGC TTGTCCCACG AAGAAATCGT TAAGTTGGGA ACGAATTTCT 
TCACGTTCGA TGTTGCTGAC GAGAACTTGC TCAGAATGAT CTACAAGAGA GACTACGAGC 
TTGTCACCAG AAACGGTCTT ACTGAAGAAC AAAAATTGGA AATCATTGAA GAATCAAAGT 
ATATTTTTGA ACAGAACGCT AAGTGTATAG TCGAGCTTGA AGCCCACAAC ATGGCCAGAT 
TAAAGCTGAA GTGGTCCTAC TTGGCTGTCA CTAAGGGTTA CCAAGCCCTC TTGGTTATCC 
TTGCCTTGCT TGCATTGGAA TACGTCAGAA GATTCATCTA CAGCTTTGCT TAGAGAATAT 
TGAATATTCA ATCCACAGCA AACAAATTTC AGTTCTATTT CTTTTTATTA TTAGTTATAC 
CTTTTGATTG CATATCTATT CACCAGTGAG GTTTGGTTGG GATGGTGTTT AATATAAACT 
GCCAGT

Protein sequence

MSKVQNSGAT TKLSQHEILP AKNDIGALAN RINSETRSLH DKVDKLVTLK MALALRDGKI 
YRQGLQSFYH VFASIEKSLH AQLEKDDEWT PMLKSVWKPE IARREKAEQD LLFYYDDRKE 
KFVNPIMPEQ IAFANHILEG TAEKPYLLFA YLHVMYLALF AGGRIMRSSF AKATGLFPHK 
NGLSHEEIVK LGTNFFTFDV ADENLLRMIY KRDYELVTRN GLTEEQKLEI IEESKYIFEQ 
NAKCIVELEA HNMARLKLKW SYLAVTKGYQ ALLVILALLA LEYVRRFIYS FA