Gene PICST_31200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31200
Symbol
ID	4838636
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	188491
End bp	190617
Gene Length	2127 bp
Protein Length	708 aa
Translation table	12
GC content	48%
IMG OID	640389951
Product	predicted protein
Protein accession	XP_001384335
Protein GI	150865212
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.645088
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCT ACGAGAAGAT CGTCAAGGGC GCCACCAAGA TCAAGGTGGC TGCGCCCAAG 
CCCAAATACA TCGAGCCCAT TCTCATGGCC ACCTCTACCG AGCTCTCGTT AGAATCCGAC 
AATTTTTCAA CAATCATGAA AACACTCCAG CATAGGCTTC AGGATCTGGC GTGGTCGGTT 
GTTTATAAGG CTTTGATAGT GATCCACATA ATGATCCGCG AAGGTGACAA AGACGTCACG 
CTCAAATACT TGGCCCACAA GAATCCCAAC ATGCTCTCCT TAGCCCTGGC TCCCGTAGTC 
AAGAACCAGG CTGCTAACGC CGACGTCCGG TTCATCGTCA AGTACAGCAA GTATTTAGCG 
ACAAGGGTCC GTCAATTCGA TACTACAGGG ATAGACTATG TTCGTGATGA ACGCTCCAAC 
AACTCGACGT TGCAATCGGG AGGTAGACTC AGAACCCTCA CTGTAGAAAA GGGATTACTC 
AGAGAGCTGG AGCTGGTGCA GAAACAGATA GATGCACTTT TGAAAAACAG CTTTATGGAA 
AATGAAATTA ACAACGATAT CGTAGTTACA GCCTTCCGCT TACTTGTAAA TGACTTGCTT 
GCACTTTTCC AGGAGCTCAA CGAAGGTGTC ATCAACATTT TGGAGCACTA CTTTGAGATG 
TCGAAAATCG ACGCTGAACG GGCCCTCAAA ATCTATAAAA AGTTCGTAGA CCAGACGAAA 
TATGTCATTG ATTATTTGCG GGTAGCCAAA CACCTAGAAT ACGCAACCCG TTTGCATGTT 
CCTACGATCA AGCACGCTCC TACAGCCTTG ACTTCATCGC TAGAGGAATA CTTGGACGAT 
CCAAACTTTG AAGCCAATAG AAAACAGTAC TTGCTGGAAA AGAAGGGAGA AACACCATTA 
GAAGCAAAGC CTCAAAATTC ACAACAGCTT CAAAGCCAAC AATCCCAACA ATCCCAACAG 
CAACAGCAGC CTGAGTTGCA GAGAAATAAT ACCTTGATTG TTCAGCAATC AACATACAAC 
CCCTGGGGCG CAGTTATCCA ACAGCCCCAA CTTGCAAATG GCACAGGCTA CCAGATCGCA 
GCATCCAATC TGATCGACGC CATGCTGCCT CAATTACAAC AGCAGAACGC TCAGCAACAA 
CAGATGTTCG CTTCTGGCTT TTCTGGTATG CCTGTAATCG TTCAGGGACA GCAATTTCTG 
CCGCTGCCTG TTGGCATCTC CACTGCCTTC ACAGGTGCGG GCTTTGGAGG CTATGGTCCC 
CAGAATCAAA ATCAGATTCA ACATGTTCAG ATTCCACAGC AGGCAACGGG CCATAATCCA 
TTTTTGCAAG GATTTTCCCA GCAGCAGCAG CCTCCTGCAG TACAGCAGCC TCTTGTAGCT 
CCGCAGACTC TTGCTCTGCA GCAGCAGCCA TTCCAGCCCC AGGGGGCAGC TCAGCAGTCG 
CAGACACAGC CAGATTTAAG AAGAGCAAGT ACGAATCCAT TCTCTACTTT GACTTCTTCT 
GTAACTGGTC ACCAAGATGG TGGCGAGTAC TCGAATCCGT TTGCCAATTC GAGGTTTGCT 
CCCAAGACCA CTACCACAGC TTTGAGCTTC AATAATGGTG TCACTACAAA TTCTGCATCT 
CCTGCCGTCG ATCCAACTGC TACGGGTAGC AATCCATTCA AGGTGAGTCA AGCAACAACT 
GCCTTGTTCA ACAATGCATC CAGCAAGGTT CAGCATCCAC AGCAACCTTT GAAGTCTCAA 
CCAACAGCAG GAGGATTGGA GCACTTGCCT GTCATTCCTG TTTTCCCTGA AACCCAATTG 
GAGAGTCAGA GAGAAAACTT CTTGACGGCT GCCAGAACTG GAATTGAAAA CCAACTCCAC 
CAACAGCAAT TTCAGCAACA GCAATTTCAG CAACAGCAAC TTCAACAACA GCAGCAACTT 
CAACAACAGC AGCAACTTCA ACAACAACAG CAACTTCAGC AACAGCAACA GCAACAATTT 
CAACAACCAC AACAACCACA ACAGTTTCCT AATCTGTTTC AACAATCACA AACCCAGCAG 
TTTCCTCAGC AGTTTTCGCA GCAGCAGTTT CCCTTTGCTC AACCACAGGT GACAGGCACG 
TCGTACCAGG GAGCCAACTT GATTTAG

Protein sequence

MTTYEKIVKG ATKIKVAAPK PKYIEPILMA TSTELSLESD NFSTIMKTLQ HRLQDSAWSV 
VYKALIVIHI MIREGDKDVT LKYLAHKNPN MLSLASAPVV KNQAANADVR FIVKYSKYLA 
TRVRQFDTTG IDYVRDERSN NSTLQSGGRL RTLTVEKGLL RESESVQKQI DALLKNSFME 
NEINNDIVVT AFRLLVNDLL ALFQELNEGV INILEHYFEM SKIDAERALK IYKKFVDQTK 
YVIDYLRVAK HLEYATRLHV PTIKHAPTAL TSSLEEYLDD PNFEANRKQY LSEKKGETPL 
EAKPQNSQQL QSQQSQQSQQ QQQPELQRNN TLIVQQSTYN PWGAVIQQPQ LANGTGYQIA 
ASNSIDAMSP QLQQQNAQQQ QMFASGFSGM PVIVQGQQFS PSPVGISTAF TGAGFGGYGP 
QNQNQIQHVQ IPQQATGHNP FLQGFSQQQQ PPAVQQPLVA PQTLASQQQP FQPQGAAQQS 
QTQPDLRRAS TNPFSTLTSS VTGHQDGGEY SNPFANSRFA PKTTTTALSF NNGVTTNSAS 
PAVDPTATGS NPFKVSQATT ALFNNASSKV QHPQQPLKSQ PTAGGLEHLP VIPVFPETQL 
ESQRENFLTA ARTGIENQLH QQQFQQQQFQ QQQLQQQQQL QQQQQLQQQQ QLQQQQQQQF 
QQPQQPQQFP NSFQQSQTQQ FPQQFSQQQF PFAQPQVTGT SYQGANLI