Gene PICST_68007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_68007
Symbol	HBR1
ID	4840334
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	-
Start bp	265555
End bp	267869
Gene Length	2315 bp
Protein Length	520 aa
Translation table	12
GC content	42%
IMG OID	640391649
Product	zinc finger transcription factor
Protein accession	XP_001385742
Protein GI	150866220
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.011178
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GACAAGAAGC CTTATTGAGA TAGACTTGAG TGTCTCCTTT TATCTCCTTT GAATCAAAAA 
CCGTCTGGGT TGAATTCGTT TTGTATATAT ATGATTTGAG TCGAACTAAA ATTAAAGTGA 
ACACTTTTCC AATTCACTAA ACGATCAACC ACGACTCTCA CAATCGCATA CGCACATATT 
CCAGAAATGA CCAAGCGGCT CAGTCCTCAT GAGAAGAAGA ATAGGAAGCC TGCATCACGA 
GCGTGCGTAT TCTGTCATGA AAAACATCTA CAGTGCTCGA ATGAAAGACC TTGTAAGAAT 
TGTGTGAAAA GGGGCCTCGC CCATGAGTGT CGTGATGTGA TACGAAAGAG AGCTAAGTAT 
CTCAACACAA ATTCACGAAG AGGCAGCGAA GCTCAGGCAC AGTCCGGTTC TAAAAGAGCA 
AGAACAAGTG TCAGTTCAAC CATAGACTCA TCGACAAGGT CTTCGCCTGG AAGCTCTAGT 
GCAGATTATC CCCATAACCC AATAGACGGA TTCATGTCAC CAACTATTAA ACCGGAGATA 
CCGTCGCCAG CATCGAATAT GGTTGTTTCT CCACAATTTG TAGGCAATGC TTTACTTCAA 
CAGGAGGTAC AACATCCTCA GCAGTTTCAT CCTCAGCAAC AACAGAAATT ATCTCTTCAT 
AACTCCATGT TGAACACTAC CAACGATGTG CTTAATAGGT TACTCGAAGA ACAAAATTTC 
AAGGACACAG ACTCCGACAA CATGTCAGCA AACTCTGTAA ATGCCAGTAG ACCCAACACT 
GCCATAGGAA CAGGAACATT CAGTTCAAAC TATTTGAACG AAGAGTACTT GATGTTGGGA 
GATATAATCT TGCATTCAAA GCCGACGTCG CCGTCGCCTT CTAACACCAG TGTTTCAGAA 
TATAATACAA ACACAGTATC TCCCAATTTT AGTAGTCAAA TCAACTACGA CGACCTTAAC 
CAGCCTCGGA GAAAAGTTTT GCAGCGACTC AAGGATTCTC GTCCCTTCAT ATCACTTGGG 
TTTTCGAACG AATCGAGCCA ATTACCTAAT CTAAACAGCA GTAATGTTAA ATTGGAGTCT 
ACTGAATTCC TTGATAACAA TGTTACCCAG CGTCCCATGT TTCAAGAAGC AATCAATAAC 
CCTCTCATGC ACAAGATAGC CCAATCGTCG TCTATTCCAA CAGAGTATGT TTCTCCGCTT 
GTAACACACC ATCTCTATCA GTCCGTACAG GATATATACA CCAACAACAT TATGAACTTT 
GATTATCCGC AATCGTATCA TCTGTTGACC CATTTTTTAA AGAAACGGTT CCTGGGGAAC 
AACCTACCTG CGGAACAAAA GCAAGCCAAA AGGCAGAGTC TACTTGTAAT TCTTAAGTTA 
ATTGCAAGCT ACAGACCTAC ATTTATTTCT GCCCACAAGT CACTCTTGAA GCCCTACGAT 
TTACAGTTCT TGGAAATGAC GTTCCAGCGT TGTTTAATTG ACTACGAGAA GCTTTCGCAG 
CTAAACTCAT CGCCCACTAT TATTTGGAGA AGAACCGGCG AAATCGTGTC GATAACGGAC 
GATTTGCTCA GTTTACTTGG TTACAATCTA GCCGACTTAT TGTCGCACCG TACATTTATT 
ATGGAGCTCA TGTATGACGA TGAGTCGATT ACCAACTATT TCCGGTTGTT TAAGACTGTC 
GCAGTCGGAA ACCTCCATCT GAGTATTATT ACCAAAATCA AGCTCACCAA AAACCAAAAT 
AGAAACGTAT CGGATCAAAC AGGAACAAGA CGGCTTTCAT ATGAGTTGTC CGAGAGGGAT 
CACATCGAGT TTTGCTCGGT ATGGACCGTT AAGCGAGACA TGTTTGATCT ACCTATGATG 
ATCATAGGTC AATTCCTACC AATTCTTCCT GCAGGAGACG GTGTGAGGAT GTACTAAAAA 
TGTGACGAGT GGAACCACTA GATGCAAAAG TGGACACACC AATACAGACA TCCACCCGCC 
CTGGTAGAGT AAAAAAATTA CATGATCATG AGACCCCTCT CGATAAGGTA ATCATCGGCG 
ATAGATTGTC ATTTCTGGGT GGTGACGGTC GATGAATAAT AAGGTGTAAG ACCAAATGCA 
GAAATGGAGT GATCTTTTAG TGGGGTGACA TTTTCTTTTT TCGCATACAG TAGAAATTTT 
TGCGACTGCC CCTTCTAACT GGATTGTCTT CCAGCTGAGC ACTATGACCA CTTAGAAGTG 
GTAGAGATCC ACTTACGAGG ACTATATATA CTGGGATTTA GGCGTATCTA TTTATTTCTA 
TTTATTCTGT ATTATACAAC AAAGACAACT TTGCT

Protein sequence

MTKRLSPHEK KNRKPASRAC VFCHEKHLQC SNERPCKNCV KRGLAHECRD VIRKRAKYLN 
TNSRRGSEAQ AHADYPHNPI DGFMSPTIKP EIPSPASNMV VSPQFVGNAL LQQEVQHPQQ 
FHPQQQQKLS LHNSMLNTTN DVLNRLLEEQ NFKDTDSDNM SANSVNASRP NTAIGTGTFS 
SNYLNEEYLM LGDIILHSKP TSPSPSNTSV SEYNTNTVSP NFSSQINYDD LNQPRRKVLQ 
RLKDSRPFIS LGFSNESSQL PNLNSSNIAQ SSSIPTEYVS PLVTHHLYQS VQDIYTNNIM 
NFDYPQSYHS LTHFLKKRFS GNNLPAEQKQ AKRQSLLVIL KLIASYRPTF ISAHKSLLKP 
YDLQFLEMTF QRCLIDYEKL SQLNSSPTII WRRTGEIVSI TDDLLSLLGY NLADLLSHRT 
FIMELMYDDE SITNYFRLFK TVAVGNLHSS IITKIKLTKN QNRNVSDQTG TRRLSYELSE 
RDHIEFCSVW TVKRDMFDLP MMIIGQFLPI LPAGDGVRMY