Gene PICST_39840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_39840
Symbol
ID	4851658
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	2471207
End bp	2472580
Gene Length	1374 bp
Protein Length	457 aa
Translation table
GC content	44%
IMG OID	640393366
Product	predicted protein
Protein accession	XP_001386807
Protein GI	126275182
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.571106
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTCGC CCGTAACCCT AGACTCGTTT CTTCAATGGG ATCCAGCACA GGTGGCTTCG 
TTCATCAACT CTGTAGTACC TGACGATGGC CGATCCGTCG GTCTTGCATT TCTAGACAAC 
AACATCGAAG GATCGTTGCT TCCGTTCTTG ACAACTGAAC ATCTCCGAGA GCTAGGCATT 
CTCAAATTAC ATACTAGACT CACGATAAAG CGAGCCATAA ACGATTTGAT TTGCCAGCAT 
TACCTGAAAA ACCCCCCGCA ATCACTAAAT GATCCAGAAT ACAAACTCAA CAACATCAAC 
ATCAACAATA ACCATATCAG CCTCGAGTCT CTTCAACTTT CCACCGTTTT AATAAAAGAC 
ATGATTAAGA AAGTGGGAGT TTTTGCCAAA CAACAGGCAC TTTCTGAAAT GTCATCGCCT 
GGCTCTCCGG GCCAGATTGA AATGAAAAAA CTCCACGATA ACTTCAACAA ACTCAAGACT 
GACTTGATCC CCGTGATACG ATTGTTGAAA GACTCGAAGC CTCTTCCCAC TCCCGTCTTG 
GATTCGCCTA CTACTAGTTA TATGAGTAGC AATTCAGACC ATGACGACAG CACTCTTTCA 
AACTCAAATG CCAACACTTT GGCACTCAGA AACGTAGCCG CTTTGAATAC GGTTGCGAAC 
AGAAACTCAA ACGCAACAAA CTTAACAAAT TTGCCCAGTC CTACTTACTC CAAGAGATTC 
TCTTCTGGTT CCATCTTATC TTTGGGAACA GGCAAAGTAG TACAACAGGC TGTTCCCAAA 
CTCGAACCCA GATTAAATAA TGACTTCCAT TTGCAGACCA TCCCTCAGAG TTTGTCTAAT 
AGAAGTATCA GTGAGTCACA CGTAGAAACT TTTGCCTCTT CACAAGCAAG ACCTCGTTTA 
GTAGAAACCA AATCTTCTGG AGCTACGCCA ACAACAGCCA ATGCATCCAA GGCAATTGGT 
AACGGATCAG TGCCTGGAGC AACTGTTCTC AAGCCAACAC TAAAACTGTA TGGAAGCAAC 
CAGCAAATCG GTCAACAACC TAAGCCATCT TCTGCTCCTG CTGCCAATGA GCCTCTAAAG 
CAGCTCAGAG CTTCTACAGA CGATTCCTGT CTCAAGATCT TGCAACAGGC AATGAAAAGA 
CATCATATTC CACGTGACGA CTGGTCCAAG TACGTCTTGG TCATTTGCTA TGGTGATAAG 
GAGAGAATCC TCAAACTTGG CGAAAAGCCT GTCGTTGTCT TTAAGGAACT CCAGGAGTTG 
GGCAAACATC CAGCCATCAT GTTGAGACAG TTAGCTCCTA CAGTAGAAGA CGATAATAAT 
ATAGAATACG TAGACTCTCG GATCGGTGAC GATATTCCGG GAGGGACGCT ATAG

Protein sequence

MASPVTLDSF LQWDPAQVAS FINSVVPDDG RSVGLAFLDN NIEGSLLPFL TTEHLRELGI 
LKLHTRLTIK RAINDLICQH YLKNPPQSLN DPEYKLNNIN INNNHISLES LQLSTVLIKD 
MIKKVGVFAK QQALSEMSSP GSPGQIEMKK LHDNFNKLKT DLIPVIRLLK DSKPLPTPVL 
DSPTTSYMSS NSDHDDSTLS NSNANTLALR NVAALNTVAN RNSNATNLTN LPSPTYSKRF 
SSGSILSLGT GKVVQQAVPK LEPRLNNDFH LQTIPQSLSN RSISESHVET FASSQARPRL 
VETKSSGATP TTANASKAIG NGSVPGATVL KPTLKLYGSN QQIGQQPKPS SAPAANEPLK 
QLRASTDDSC LKILQQAMKR HHIPRDDWSK YVLVICYGDK ERILKLGEKP VVVFKELQEL 
GKHPAIMLRQ LAPTVEDDNN IEYVDSRIGD DIPGGTL