Gene PICST_80114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_80114
Symbol
ID	4851434
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	1805749
End bp	1806836
Gene Length	1088 bp
Protein Length	297 aa
Translation table
GC content	42%
IMG OID	640393142
Product	predicted protein
Protein accession	XP_001387982
Protein GI	126274562
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.301364
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGTGT GGGCGTTGTT TCGAGTCATC CTCTTGATCC GGGCGGTGCT TGCAGTCGCC 
AGCACTGGAT CAAAAGGCCT AAATCAGCAT ATTCGTGAAT TCGGCGATTC AGCCATTGAA 
GATAATCTAA AGCGAGCCAG ATATTCTCTA ATTTACTTCT ATAGAGATGC GTGTCAGTAC 
TGTGATAAGT TCAATCCGGA CTTTGAGAAC TTGAGCGTAC TATTCAATAA CGCTAGTGAC 
TCTGGGGAAG GCGAGAACAG TATTATTCAG GTTATCAAGA CGAATGGGAA GGTCAACCCC 
AGATTGAACC AGCTTTTCAA GGTTCAACTG TATCCGACCT TGAAGCTTTT GGACTTCAAG 
ACTATGGAAA TATTCACATA CACGAAAAGA AAAAGAGATA TTCTCTCATT ACTTGAGTTT 
GTCAAGGAAA AAGTGCCAGA CGCAAAGCCC AACTATAAGA ACTTTGTCTC CAAAGTCAAA 
TACTTGGATA ATGCTAGCTT TGATGACCAT GTCAAACAGC TGAAGAAGGA TACGTTGGTG 
GTTTTCACTA TGCCATATAT GGACGACTGG ATCAACTACC AATATCCTGC TCATTTCTAT 
CAGCAATTGG CCGATAGAAT GTCTAGCGAT GAACGTAACA TTCAATTCTC TCTTGTAGAT 
GCTGGATCCC AAGCAGCCAG TGATGTAATA GCTGGACTAA AGATCAGCAA CTTCCCATCT 
ATAGTCTATT TCAAGGGAGA CGGTAGAGTC AAAGCTTATG GAGTTTATGA CCAGAACCAA 
GTAATGCATG GGATATTGAG TGAAAAAACC TTGGACAGCT TCATAGACAA TATAGATTCT 
GAAGAACATG GAAAATGGTT TGAGTCTGTT GAGAAGATGG TAGAGTCCAG GGAAGAGTCT 
ACGGAGTACG ACGGAAACTT GCACTACAAG CCAGGATTCA ACGTGAGACA GGATAATCGA 
AATGGAGAGG ATGAAGAGGA GCAGTATAGA CAGCTCTTGA GAGAGGTAGA GTTGTAATGC 
TACAATGTAT ATAGATATCT ATACCTGGTA TATAGCAGAA GAACTTCAGG GCATATTTGA 
CATTTTCC

Protein sequence

MQVWALFRVI LLIRAVLAVA STGSKGLNQH IREFGDSAIE DNLKRARYSL IYFYRDACQY 
CDKFNPDFEN LSVLFNNASD SGEGENSIIQ VIKTNGKVNP RLNQLFKVQL YPTLKLLDFK 
TMEIFTYTKR KRDILSLLEF VKEKVPDAKP NYKNFVSKVK YLDNASFDDH VKQLKKDTLV 
VFTMPYMDDW INYQYPAHFY QQLADRMSSD ERNIQFSLVD AGSQAASDVI AGLKISNFPS 
IVYFKGDGRV KAYGVYDQNQ VMHGILSEKT LDSFIDNIDS EEHGKWFEMK RSSIDSS