Gene PICST_48819 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_48819
Symbol	MIG2
ID	4840200
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	-
Start bp	1682023
End bp	1683192
Gene Length	1170 bp
Protein Length	250 aa
Translation table	12
GC content	48%
IMG OID	640391515
Product	DNA-binding protein (Carbon catabolite repressor)
Protein accession	XP_001386018
Protein GI	150866422
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

AAGAAGGATC CTTCCTCCAG ACCGTACAAA TGTCCTCTCT GCGAAAAAGC GTTTCACCGC 
TTGGAACACC AGACCAGACA CATCCGGACC CACACTGGCG AAAAACCCCA CGCGTGTACA 
TTTCCTGGCT GCTTCAAGCG GTTTTCAAGA AGCGATGAGT TGACTCGTCA CTTACGGATT 
CATACTAATC CAAACTCGAG AAGAAACAAA AACTTAAACA AACACAACAT CAACTACACC 
AACAATCCGC GCAACATCAA GCTGGAAGAT CCAGAAAGTC CGTCTGTAAC CTCAGATGAA 
GCATTTACAT CGTCTCAGTC AGCGGCTACT CCGAAAAAGA AAATGATGCT GTTGCCGTCT 
CGTAAAACAG CCCTGGCGAC GTCTCCACAA GCAGTAGATA TAAGAGTGAA GTCCGAGCTT 
CTGAAGTCGT CCACCAATTC CAGCGAGGAT GAAGACGTCA GCACAAAGAC TCAGACACCT 
CCCTCAGACT CAGACATAGT CATGTCCATA GCGAAACTGG AGCCTTCTAC CACAAACTCG 
TCGATGCCAG CTCCTCCTCT AACAAAGCTT CCCAGCACGA TGAACATCGA TATTTTGGCC 
AGCGCTGCAT CCGAGGAACT CAGCAAAATC GCCAACCCAT CAAAATCGCT TCCTTCTCTT 
ACAGACTACT TTGGAAACAG CATGAACAAA GCGCCAGGCG TCCACTACAA CTTCTCCAGT 
GATAGAGCCA CGTTCCATCT CAATGACTCC AAATCCAGCA ACAGTCTCCA GTACTTGTCT 
AGTATCGCAA CTTTGACAAA CACACATGAA AATCAGAATC CGCCCTTTCT TGTTCAAAAG 
CCTAAGGCTG TGTCAACAAA CAAACTCAGC ACGTTATCCT CGCTCCAGAG AATGACTCCC 
ATCACGCAAA ACGGAATCTA CCACCCAGAG CCATCGCACA ACAAGTCTCA CATAATAGAA 
GACTCGGACC TTGACTACGT CAAGCTGAGG TTGAAAAAAT CGAGACCTAA CAGCCCCAAC 
CCAAAGCCGT TCACCTTACC CAATTCGCCT GTTCTCGGAC TCTCGTCGAA TAACACCCCT 
ATCATCTCGG CTAACAACAG TTCGACGAAT TTGTCGTCGT TGTTGATGAC TCCGGCCTTT 
AGAACTACCA GCATGGACCA CAACTCCACC

Protein sequence

KKDPSSRPYK CPLCEKAFHR LEHQTRHIRT HTGEKPHACT FPGCFKRFSR SDELTRHLRI 
HTNPNSRRNK NLNKHNINYT NNPRNIKSED PETPPLTKLP STMNIDILAS AASEELSKIA 
NPSKSLPSLT DYFGNSMNKA PGVHYNFSSD RATFHLNDSK SSNSLQYLSK PSHNKSHIIE 
DSDLDYVKSR LKKSRPNSPN PKPFTLPNSP VLGLSSNNTP IISANNSSTN LSSLLMTPAF 
RTTSMDHNST