Gene PICST_30617 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_30617
Symbol	ZIC3
ID	4838057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	519625
End bp	520875
Gene Length	1251 bp
Protein Length	416 aa
Translation table	12
GC content	45%
IMG OID	640389372
Product	zf-C2H2 Zinc finger, C2H2 type
Protein accession	XP_001383735
Protein GI	150864766
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.995284
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCTCT CTGAAAAAGA AGAAGAACTC CCAACAGAAG ACAAACCAGG ATTCCCATGT 
AAATGGCAAG ACTGTGAAGT AGACATCTTT CCCCTGTTGA CGGGATTAGT GGACCATCTC 
AACACAAATC ATTTGGCCCA TATGGCACAC TTGACACCAA CGACTCCTAT CAGATACACC 
TGCCAATGGC AAGGCTGTCC TCGTTTTGGC ATTGAACAAC CTTCACGTTT CGCTCTCATT 
TCCCACTGTA GAACCCACAC CGGTGAGAAA CCGTATTTTT GTCCTATTCC CGAATGCGAG 
AAACACTTTA CAAGGTCAGA TGCTCTTGCC AAGCACGTCA AGGGAGTTCA TGATTTGCAC 
ACTATAAAAG ACGCTGTGAA CTCTATCAGA GACAAGTATG CCAAAGGAAC TTTGTCAGCT 
GTAGCTTATG ACTGGCTCGA ACTAGATGAA TTCAATGAAG ATATGTATCT CCGCTTAGTT 
GAAGAGGATT ATGAGTACAA GAACCCATGG TGGTATTCTC AGAAGTTCTT GGACGTCTTG 
AAGGAAGGAG GAGTTCATCT GGTAGGGTAT GAAGATGAAG ATGAAGAAGA AGAAGAAGAA 
GACGAAGACG ACGACGACGA CGATGACGAC GAGGAAGAAG ATGGAGATGA TGACGAAGAC 
GAGTATGATG GTTCGGTTCA CAAACACAGT AAGAAAACTC TCACTGCTGG AGGCAGCATA 
ACTGCCGATG TTTTCTTCAA CTTGCCTTAC AATTTCACCC AGCACAAGAT AGCCGCCATA 
CGGTACCAAA ACTATTTTGC AGAAGATGAT GGCGAAGATT TACTTACGGG TGAAGACGAT 
AACAACAAGA CAATTAATCT CGTCAAGAGA CAACAACACC ACGACAGCCC AAGTAGAAAA 
CACAAGGACG TCAATTCCAA TTCTTTACAC AAATTGCTCA AACTGAAAGC ACGAGTGTTG 
AAGACAGGTT ACCCAGCTAT AGAGACCCCA GATGTAGAAG ACATCGATGA TCTTGCCGAG 
TTGAAGTCGC TCCATGCCAA GTTGACTAGC CAGCTCAACA CTGCCTCTAA GATTAACAAG 
GTCGTGGGAA AGCAGCTTTC TGTCTCCATA AAGCAGAAGC GTAAGCTCTG GTTGATCAAC 
CAGTTGTTGA TAGATGGCAA CTTAGAAGCT GGGCTTCCAC TCAAAAGGCT GACTGAGCCC 
CAGCGCGTTG CCAGAGACGC TGTAGATAGA GAGTTATTGA GAACCACCTG A

Protein sequence

MSLSEKEEEL PTEDKPGFPC KWQDCEVDIF PSLTGLVDHL NTNHLAHMAH LTPTTPIRYT 
CQWQGCPRFG IEQPSRFALI SHCRTHTGEK PYFCPIPECE KHFTRSDALA KHVKGVHDLH 
TIKDAVNSIR DKYAKGTLSA VAYDWLELDE FNEDMYLRLV EEDYEYKNPW WYSQKFLDVL 
KEGGVHSVGY EDEDEEEEEE DEDDDDDDDD EEEDGDDDED EYDGSVHKHS KKTLTAGGSI 
TADVFFNLPY NFTQHKIAAI RYQNYFAEDD GEDLLTGEDD NNKTINLVKR QQHHDSPSRK 
HKDVNSNSLH KLLKSKARVL KTGYPAIETP DVEDIDDLAE LKSLHAKLTS QLNTASKINK 
VVGKQLSVSI KQKRKLWLIN QLLIDGNLEA GLPLKRSTEP QRVARDAVDR ELLRTT