Gene PICST_33170 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33170
Symbol
ID	4840241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	+
Start bp	1593416
End bp	1595332
Gene Length	1917 bp
Protein Length	638 aa
Translation table	12
GC content	42%
IMG OID	640391556
Product	predicted protein
Protein accession	XP_001385663
Protein GI	150866163
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.121339
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.2488
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGTTG GGAAACTCAA AAAGGGGTTG ACGGAGTTCG GGTCCAGTGT AAAGGACACA 
GTCGTATCTG TCTCAGATAC TGTGACTACG GTCAGAATTC ACAGGGACTA CGACAAGGAC 
GACGAGCTCA TTGAACACTA CAAACATGAC TTGAGCAAGG CAAAGCTGGG ATTAAGCTAC 
ATCGCCTCAC AACAGAAGAA AATGGCTCTG AGTCACTGGG GAAAGCTTTT TAAGCTCAAC 
ATACGAATTG TAGAACACTT TATTCAGCTT TTAGGAACAG ACTCTCTCAG CTTCAAAGGT 
ATTGAGGATT ACTACCATGA CTTCGACAAG TTCCAGGCCA CAGAAGAAAT ACCCATGGTA 
CATCCCAAAG AGAGGCAGTT TCTCATAGAA AGTGTTCATC TGGAGTTGGT CAACTACATG 
AGCTCGTTGC AACAGGGAAA GTTTAAAATC ACTCAGGACT GGGACATTCA TGAAAAGAGT 
CTCAAGCTTA GAATTACAGA AATGAACAAA CATATCAGCG ATACGCTAAA GTTGATCAAA 
AAGAGAAACA AGAAGAAAAC TAACTATATC AAGACTGAGC ACAAGATTTC CAAGTTAATG 
AAGAAGACGG CACCGCTCGA GACAAAGGAG CAGGACCAGT TGAACACTCT CGAGTCTTCA 
TTAAAGGAAG AAGAAAAGGA ATACACAAAG ATCAACGACA AACTCAAGTC CATCTTGCCT 
CATGTAATTT CGTTTTTGGA TGAGTTCGTA GAGAATATCA CCAAGATCAT ATTGTGCAAG 
CAGGTGGAAA CATACAAGGA AATTGCGCAA ATGCTCGATT ACTTCTGTAC TTTCCACGGC 
TTTTTGGACA CTTCCGGAGA TCCGCATAAC AAAATCCAGT CTTACGAGGA TATAATCAGT 
AAATGGGAAG AGGCTACGAC TCCAACTAGA TTGCAAATCG AATCCTTTAT CTCCATCATC 
TACGACAAGA AACCAGAGTT GATAGATACT GAGATCGACG AAAAGGATAA AACGCTGTCT 
GCTGCAAAGA TGTGGAACAA GATCACAGAC AAGGTTGTAG AAAAGAAACA CACTGTCAAA 
ACGAAGGATC ATGTGAACGG AATCTTCAAC GACTATTTGT CTGTTGATCC ACTCCAGGCT 
TTTCTTCAGA ACAATGACCC CAACAGTAAC ATCTCGGAGA CGTATCATCC GTCCAAGGTG 
GTCGATGTAG ATGATGTCTA TATTCCTAAA CCTGTTACTG CGCCAGTAAT TTCACCTAAA 
CTACCACCAA GAGTCAACAC CGCTCACAGC TCTAAACCTT TGCCTACCGT CGCGGCCAAT 
AAAGTCACTA CCCCATTGCC ACCCCTTCCA CCTGACAGAT TTGTTTACAA CAGTAACTTC 
TCGCGCAGTG ATTCCTTGGA CTCAATTCAT TCTGATAACG AGTCAATCAT ATCTGATTCT 
TCTTCCCACA GTACTACTTC TCTTGTCAGT GACATACTCC TTCACAATGC CTCCGCTGAT 
GTTGTGAACA AGCACTTGAA GAAGGTCTAT AATTCGTCTA AGAATGACAT CAAGTATTCT 
CCTATTCCAG AGAGATTTGC TGATTTGGAT ATACCTCCCG CAACAGATGA TCTTATATTC 
CAAAAGACCA CTACTGTAAC CTATAAGTTG CACGAGTTCA ACAAGTTCTT CGACAAAATT 
ATCGCATTGT CAGATTCGAT GCAATTGGAT CGACGTGTTT TGGAGGCTAA ATATGATTTT 
CCTGGTATCG AGCCGGGTGA CTTGTCTTTC AAAACAGGCG ACAAGATCGA AATCATCTTT 
GACTTTCAGT CCATCGACAC TTTATATAGT AATGACCAGA AGAACTGGTT GATTGGCGCC 
TCCAAGTTCG GCCAAGACCA TTTCCGGATT GGATTTGTTC CAAGCAATTA CTTCTAG

Protein sequence

MSVGKLKKGL TEFGSSVKDT VVSVSDTVTT VRIHRDYDKD DELIEHYKHD LSKAKSGLSY 
IASQQKKMAS SHWGKLFKLN IRIVEHFIQL LGTDSLSFKG IEDYYHDFDK FQATEEIPMV 
HPKERQFLIE SVHSELVNYM SSLQQGKFKI TQDWDIHEKS LKLRITEMNK HISDTLKLIK 
KRNKKKTNYI KTEHKISKLM KKTAPLETKE QDQLNTLESS LKEEEKEYTK INDKLKSILP 
HVISFLDEFV ENITKIILCK QVETYKEIAQ MLDYFCTFHG FLDTSGDPHN KIQSYEDIIS 
KWEEATTPTR LQIESFISII YDKKPELIDT EIDEKDKTSS AAKMWNKITD KVVEKKHTVK 
TKDHVNGIFN DYLSVDPLQA FLQNNDPNSN ISETYHPSKV VDVDDVYIPK PVTAPVISPK 
LPPRVNTAHS SKPLPTVAAN KVTTPLPPLP PDRFVYNSNF SRSDSLDSIH SDNESIISDS 
SSHSTTSLVS DILLHNASAD VVNKHLKKVY NSSKNDIKYS PIPERFADLD IPPATDDLIF 
QKTTTVTYKL HEFNKFFDKI IALSDSMQLD RRVLEAKYDF PGIEPGDLSF KTGDKIEIIF 
DFQSIDTLYS NDQKNWLIGA SKFGQDHFRI GFVPSNYF