Gene PICST_58842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_58842
Symbol
ID	4838705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	1596969
End bp	1598033
Gene Length	1065 bp
Protein Length	354 aa
Translation table	12
GC content	43%
IMG OID	640390020
Product	predicted protein
Protein accession	XP_001384610
Protein GI	150865407
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.040839
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00802664
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTTCAGAT TAGCCAGAAG AAAACTTGCC ACTTCAGCTG ATACCATAGC GAAACAGCAG 
CAGTTCAACG TCTTTGACCG TTCAGCAAAG TTGCTCCAGA GATCCAGAAC ACCTTTGCTC 
AACCCTGAAT TGCTGAGAAA GAAGGAATAT TTACGTGACG AGGTTGCTCT AAAAACCATT 
GAACGTTTGG CATTCATCAC AAGAGACTTT ACAAATGTTC TAGATTTTGG TTCTCATCTG 
GGGAACTTGT TGAAGAATCT CTGTGTTGAG ACAGAGATTC CACCAGACGC AGACTATGCC 
GAAACTGAGA TCACCAAACA GTTGAATAAT GACAAGAAAA TCATCTGTAG TAAGATCAAA 
GAGTTGACCA TGGTAGACTC GTCAAGGGAA TTGCTCTATA GAGATGCTGA GGAAAGTTTC 
AATAGCGTAT TTCCGGGTAA GGTTATACGA AGTGTAGCGG ACGAAGAAAT TTTTTCACAC 
GAAAGTCTTT CGAAGCCAGA ACATTATGAT GCTGTGATTT CTAACTTGTC GCTCCATTGG 
ATCAATGATC TTCCCTCGAC GTTAGCTAAC ATCAACAGAA TCTTAAAACC TGACGGCTTA 
TTCATGGGAA CGTTATTTGG AGGGGACACT TTGTACGAAT TGCGTACTTC GCTACAACTT 
GCTGAGATGG AGAGAATGGG TGGAATGTCG CCCAGAGTAT CCCCTTTAGT TAATTTAAAC 
GATATCGGCT CCTTGTTGAA CCGTGCTGGC TTCAGTATGT TAACCATTGA TGCAGAGGAT 
ATCATTGTAG GAGGATTCCC AGATATTGTT TCTGTGATGG ACGATTTGCA GGCCATGGGA 
GAACAGAATT CGGTCTTATC CAGATCGGGA TATTTGCCTC GTGATGTCTT ACTAGCAGCC 
AACGAGATAT ACAAAACTAT GCATGGAGAA AAAGACGATA ACGGTGTCGT TACGTTACCT 
GCTACGTTCA ATATTATCTT TATGATAGGT TGGAAGAAGA GTGAGAATCA GCCCAAGCCA 
TTGGCCAGAG GCTCTGGGCA GGTCAACTTG AAGGACGTAT TGTAG

Protein sequence

MFRLARRKLA TSADTIAKQQ QFNVFDRSAK LLQRSRTPLL NPELSRKKEY LRDEVALKTI 
ERLAFITRDF TNVLDFGSHS GNLLKNLCVE TEIPPDADYA ETEITKQLNN DKKIICSKIK 
ELTMVDSSRE LLYRDAEESF NSVFPGKVIR SVADEEIFSH ESLSKPEHYD AVISNLSLHW 
INDLPSTLAN INRILKPDGL FMGTLFGGDT LYELRTSLQL AEMERMGGMS PRVSPLVNLN 
DIGSLLNRAG FSMLTIDAED IIVGGFPDIV SVMDDLQAMG EQNSVLSRSG YLPRDVLLAA 
NEIYKTMHGE KDDNGVVTLP ATFNIIFMIG WKKSENQPKP LARGSGQVNL KDVL