Gene PICST_67866 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_67866
Symbol	AZF2
ID	4839292
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	-
Start bp	950442
End bp	951870
Gene Length	1429 bp
Protein Length	465 aa
Translation table	12
GC content	46%
IMG OID	640390607
Product	asparagine-rich zinc finger protein
Protein accession	XP_001385190
Protein GI	126137333
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.12306
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAGTA AATTGAATAT GATTAACAAC CTCAAGAAAC GGGCCGAGAT CCGTGCAGAG 
ATCCGATCCA GTATAAAGCC TGCCGACAGC TTGGAAGAAG GAGAAGTTTC CAATTCTGAA 
AACCACGGCA AAAATGATGA ATTAGATCTT GATGAAGGTG CCAGCTTGTC TCAGCTAGCC 
GAGGAAGGTG CAGAGGAAGA TCTAAAGAAC AAAATCAAGC GTGAGCAGAT TGAACAACAG 
TTGCTAGGGG TGCACACAGA CGAAGAGGGA GACAGAAGTG GTTCCGAACT AGAAATATAC 
TCTGATGCTG GTGATGACGA TTTCATCCCT GAAGTCAATG GGTCAGGCGA CAGAGTCCAC 
GGTGGGCAAC ATGAACGAGA TGTTCAGCAC GAATTAAGTG CTCAACAGAT GCGTCAGGTT 
GAAGAATTCA GTCGGGCAGT AGATGGGCAA GTTCACACTA TAGACCCTGA TCTCATGCCT 
GAGTCTACTT CCAAAAAGAG AAATTTGGAT ATTACCTTGC CAGGGACTGC TGGTCGATTG 
GCAGGATCTG TAAATCCATC CAGCGAAGCT GCTGTTGCTG TAGATGCCGT GGCTTCAGCT 
GTAGCCTCCG CTGTAGCAGG TGATATAGGC GCTACCATGT CACATGAAGG AAAGGTCAAG 
CGCAGACAGA CTACTGCTGT TCGGGAGGAC GAGAAAGTTT GTCCCTATTG TAAGCAGGAG 
TTTGACTCGG CAGTAGATTG TAGGAACCAT CGTCGCACTC ATCCCAAGCC CAAGGTTTAT 
AAGTGTGGAT TGTGTGACAA GACGTTTAGT CAGATTCCGA ACTTGAGTTA CCACCGAACG 
ATCGTCCACA AAGACTTGAG AGTAGTCAAT GGAATTGATA CTACTAGTGT AAATGCGGCA 
ACTGGTTCTA GCAACCCTAC TGTTGCAAAC TTAGCTGCTG TAGCTAGTTC CGCAGTGGCG 
GCCAGTGTAC CACTTGTGGA TCTTCAGAAT GTGCGAGTTT TCCATTGTGA CGAAGTTGAT 
TGCACTTTTA CATATTTGAC ATACCAGGCT CTATTGGCAC ATAAAGAAAA TGACCATAGT 
GGAGTTAATG TTAAGCGACC ATATCGTGTT TCGAAGGCTA CAAAAAAACA TGCGTGTACG 
TTTGACGGCT GTAACAAGGT GTTCGCAAAG TTTTCTGATT TGACCAGACA CTCACGAGTT 
CATTCAGGCG AAAGGCCGTT TGAGTGTACT CATTGCGGAG CTACTTTCAA CCAGAAGTAC 
CGCTTGACCA CACATTTACG TTCACATACT GGCGAAAAGC CGTTCTCCTG CAAGTACTGT 
GGAAAGACAT TTGCTCGAGG TGATGCTGTG CAATCTCATA TCTTTGCTAT ACATAGAGCC 
AAAGGCTCAG CTTTTTAGAG ATATATAAGA TGAATTGAGA ACTACGGGT

Protein sequence

MASKLNMINN LKKRAEIRAE IRSSIKPADS LEEGEVSNSE NHGKNDELDL DEGASLSQLA 
EEGAEEDLKN KIKREQIEQQ LLGVHTDEEG DRSGSELEIY SDAGDDDFIP EVNGSGDRVH 
GGQHERDVQH ELSAQQMRQV EEFSRAVDGQ VHTIDPDLMP ESTSKKRNLD ITLPGTAGRL 
AGSVNPSSEA AVAVDAVASA VASAVAGDIG ATMSHEGKVK RRQTTAVRED EKVCPYCKQE 
FDSAVDCRNH RRTHPKPKVY KCGLCDKTFS QIPNLSYHRT IVHKDLRVVN GIDTTSVNAA 
TGSSNPTVAN LAAVASSAVA ASVPLVDLQN VRVFHCDEVD CTFTYLTYQA LLAHKENDHS 
GVNVKRPYRV SKATKKHACT FDGCNKVFAK FSDLTRHSRV HSGERPFECT HCGATFNQKY 
RLTTHLRSHT GEKPFSCKYC GKTFARGDAV QSHIFAIHRA KGSAF