Gene PICST_84845 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_84845
Symbol
ID	4840319
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	+
Start bp	1639778
End bp	1641187
Gene Length	1410 bp
Protein Length	402 aa
Translation table	12
GC content	44%
IMG OID	640391634
Product	predicted protein
Protein accession	XP_001385675
Protein GI	150866173
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATCATTATCA AAATATATAT AAGTTCTTGA ATCATCAGAA CACTATCGAC GCATTTTTCC 
AGTAGATGAC CGGGCTTTTG TCTTATCTTC ATTATTCAGC AATTTGAATT TTTACAATCA 
AATTATTCCT AAATCAAGTA CCATATTCCA CCAAATAAAA TGGACGCTTC TTCTTGTGGA 
CCTTCCAGCG CTTTGGCAAA CCTTTCCAAA CACACTCAGC GTGACAACAC TCTTCAGAAC 
GAGTATGCAG CCAAAAATGC CCAACTCCGG ACTGGCCCAG CCGGTTTTCG CCAGAATGGA 
AATGCTGTAG ATGCCAGATT GAATGCTGAG TTCCACAACT TTCAAGGAAA TGGATTAGGA 
GCCGAATTTC CAGCCTTTGC TGGAACCCCT TCTTTTCAGC AACAAGCTCA ACACTTAAAC 
CAGCAGCAGT TTCAGCCAAA CAATGCTGGC TGGGTCCAGG ACTTCTCGGG CTTGTCTATC 
AGTAACCAGC CACAGCAAGT AGGTCATCCT CAAAGTGACT GGCACCAGCA GTTTCTTCAA 
CAACAGCAAC ATCACCATCA ACAGCAGCAA TTTGAGCAGC AGAATATTCA GCAGGGTCAG 
CAGTTTGCAC CAAATTATGC CCTGAGTGCC TTTTCTATGA ATATGAGAAC CAATTTGTCT 
ACGCCTTTAT ATGCCCAGCA GCAAGTTCAA ACTGGCGCAC TGCTTACGGA GCACCAGGAG 
ATTCATAAAA TGGAACAGGA GAAACAGCTT TTTGATTCCC ATTTTGATCA ACTTGAGAAG 
GAATTGAACC AACAGCTGCA GGAAAAGCCA GAAGTAGAGG TACAAGTAGA CAAAGTTGAA 
AACGAGCAGT TTGCTGAGAC AGCTAGACAA ATCGAAAATT CCTTGCGACA ATTCGACACT 
GCTGATGCTG CAACTAAAGC AAAGATAGAG AACTCAGACT TCTTGAAGTT GATGAGCTCC 
ATTTCCAACA AACAAGTAGT ATTGGATGGC GACAAATTGG TAGACTCTAC AGGCCAGGAT 
ATTCGCGAAA ATGTGAACGA ACCTTTGCAA CAAATCAGTA GACCTGACTA TCATGATCCT 
ATTCACGACA TACCCGTTCC TGTGCGGCCG ATCACGAGAA ATCCGGCTCA GGCTGAAATA 
CAGCAAGAAG CCAGACCAGA ACAGATTAAC AAATTACCGG ATCCTTTATC CCATATGCAA 
GATGGACTGT TAGGCGACGT CTATGATGCC TTATCCGCAG CTAAAGTAGT CTCAGGTGGA 
CAAGTCAAGA CAGGAGACTG GGTGGATGAA GATGACGAGT GGCTTGATAT GACTACTCCA 
TCTATAAGCA GGCCAAAGAA GGCAAGCATC ATGGCAGACC ATTGGCAAGA AGTGTATGAC 
GACTATAGAA ATGACGATGA TTTTCATTAG

Protein sequence

MDASSCGPSS ALANLSKHTQ RDNTLQNEYA AKNAQLRTGP AGFRQNGNAV DARLNAEFHN 
FQGNGLGAEF PAFAGTPSFQ QQAQHLNQQQ FQPNNAGWVQ DFSGLSISNQ PQQVGHPQSD 
WHQQFLQQQQ HHHQQQQFEQ QNIQQGQQFA PNYASSAFSM NMRTNLSTPL YAQQQVQTGA 
SLTEHQEIHK MEQEKQLFDS HFDQLEKELN QQSQEKPEVE VQVDKVENEQ FAETARQIEN 
SLRQFDTADA ATKAKIENSD FLKLMSSISN KQVVLDGDKL VDSTGQDIRE NVNEPLQQIS 
RPDYHDPIHD IPVPQEARPE QINKLPDPLS HMQDGSLGDV YDALSAAKVV SGGQVKTGDW 
VDEDDEWLDM TTPSISRPKK ASIMADHWQE VYDDYRNDDD FH