Gene PICST_40963 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_40963
Symbol
ID	4837211
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	699499
End bp	700569
Gene Length	1071 bp
Protein Length	356 aa
Translation table	12
GC content	43%
IMG OID	640388526
Product	predicted protein
Protein accession	XP_001382899
Protein GI	126132748
COG category	[R] General function prediction only
COG ID	[COG1094] Predicted RNA-binding protein (contains KH domains)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTTCGA CTCATAACCG TGACAAGCCC TGGGATACTG CTGACATAGA TAAGTGGGCA 
CTTGAAGAAT TCAAGCCCGA GCACAATGCC TCAGGACAGC ATTTCACTGA GGAGTCAAGT 
TTTATGACTC TTTTCCCTAA GTACAGAGAG CAATATTTAC GTAGTATATG GGCAGATGTC 
ACAAAGTCTC TTGAGAAGCA TTTTATCAAG TGTGAGCTAG ACTTGGTGGA GGGTGCTATG 
ACTGTAAAGA CCACTACCAA GACGTTTGAT CCGGCTATAA TTTTAAAAGC CAGAGACTTG 
ATCAAATTGT TAGCACGTTC TGTGCCTTTT CCACAAGCTG TTAAGATTTT GCAAGATGAC 
ATTGCCTGTG ATGTAATCAA GATCGGTAAC TTTGTAGCTA ACAAGGATCG TTTTATAAAA 
AGAAGACAGA GATTGGTGGG ACCTAATGGG AACACCTTGA AAGCATTGGA ATTGCTTACG 
AAGTGCTATA TTTTGGTCCA GGGAAATACT GTGAGTGCCA TGGGTCCATT CAAGGGTTTG 
AAGGAAGTCA GAAGAGTAGT TGAGGATTGT ATGAGAAATG TGCATCCTAT CTATTACATC 
AAAGAGCTTA TGATTAAGCA AGAGTTGAGC AAGAAGCCTG AGTTGGCCGA GGAAGACTGG 
TCGAGATTCT TGCCTTCTTT CAAGAAGAGA AATGTTGCCC GTAAGAAGGC CAAGTCGTCC 
AAGAGAGAGA AGAAGGTGTA CACTCCATTC CCACCAGCAC AAACTCCACG TAAGGTTGAT 
TTGCAAGTGG AAAGTGGTGA GTACTTCTTG GGCAAGAAGG AAAAGGCAAT GAAGAAGTTG 
AAGGAAAAGA GGGAAAAGCA AGAAGAAGCA TCTGTGGCTA GAAAGCAAGA GAGAGAGAAG 
GATTACGTAG CCCCAGAAGA AGAAAAGTAC GAGAACAAGC TTGCCAAGAA GGAGAAGAAG 
GAGAAGAAGG AAAAGAAGGA AAAGAAGGAA AAGAAGGAAA AGAAGGAAAA GAAGAAGAGA 
TCCGCCAGCG AGGAAGAAGA AAGGGGTTCT AAGAAGTCCA AACATGCATA A

Protein sequence

MVSTHNRDKP WDTADIDKWA LEEFKPEHNA SGQHFTEESS FMTLFPKYRE QYLRSIWADV 
TKSLEKHFIK CELDLVEGAM TVKTTTKTFD PAIILKARDL IKLLARSVPF PQAVKILQDD 
IACDVIKIGN FVANKDRFIK RRQRLVGPNG NTLKALELLT KCYILVQGNT VSAMGPFKGL 
KEVRRVVEDC MRNVHPIYYI KELMIKQELS KKPELAEEDW SRFLPSFKKR NVARKKAKSS 
KREKKVYTPF PPAQTPRKVD LQVESGEYFL GKKEKAMKKL KEKREKQEEA SVARKQEREK 
DYVAPEEEKY ENKLAKKEKK EKKEKKEKKE KKEKKEKKKR SASEEEERGS KKSKHA