Gene PICST_32340 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_32340
Symbol
ID	4839336
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	-
Start bp	1259819
End bp	1260845
Gene Length	1027 bp
Protein Length	314 aa
Translation table	12
GC content	44%
IMG OID	640390651
Product	predicted protein
Protein accession	XP_001385249
Protein GI	150865863
COG category	[R] General function prediction only
COG ID	[COG0724] RNA-binding proteins (RRM domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.46857
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.27086
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCGTT CAACATGGCC TTATTTGGTG AATAGCGTTC GGATTTTTCA TCTTTTTTCG 
ATCAACATCT ACTAACATAA TTTAGACTGA TAATACTGAG AAGTATCCTC CGGATATCCA 
GAAGCTTTTT GCACCCAAAC CGCCGCTCTT GTATTTGCTG TCTTCAGATT TTGCAGCTGG 
ACAGAGAGCC ACAGCATCCA TAACACCCGT TTCAGCCTGG AGATCTGAAA TTGACAAATA 
CACCGTTCAG TTGAAGGAGC AGGATTCTTC CAGCATAAAG AAACAACCAA CAAAACACCA 
ATTACAAGAA GAAGCTGCTC GTGAAAAACA GCTTCTCAAG CGAGAATCGT TCAAACGACA 
ATTGCGCGAA TGGAATGATC CCGAAATATT GCATCAAAAT GAGAAAGAAT TCATGAAAGA 
TCCATATAGA ACCATCTTTG TCTCTCGTTT AGACTTCAGC TTAACCGAGC TTGATATTTC 
TAAGCATTTC AGCAAGTATG GCGTGATTGA GTCTGTGCGT ATTATACGTG ACTCTGTAAC 
CGGTAAATCT CGAGGATACG GCTTCATAGT GTTTGAACGA GAGTGGGATG CCCAGAGCTG 
TATCAGTGAA GTGGCGAGAA CAGGTGTAAG ACTTCCACAA GCAAAGAGAA CTATTTTGGT 
AGATATAGAG AGGGGCCGTA TAGTGCTGAA CTGGCGTCCG CGCAGATTAG GAGGAGGTCT 
AGGAGGTAGA CACTATACGA GACCCGATCC CCGTTTCAAT AGTACAGCTT CAGCTGCAGC 
CAGTGGTAGA AGTATTAATA TTGCTAACAA CCCACATATA CCGTCTGGTC ATAGTGGCCA 
TCGCCAGCAG CCGTCATATT ATCCTCCAAC ACAGAGTACG TTCAAGAGCT ATCCTAAAGA 
AACCGAAAAG AAACCGGAAA AGTCTGTCAA GGACAAGTAT GCCAAGTATG CTGCTGTTCT 
GGAGTCGTCT GGTGGTTACC GTTCTGTGGG AGAGACCCGG TCAATCAGAA GTATAAGGCA 
GGGGTAA

Protein sequence

MTDNTEKYPP DIQKLFAPKP PLLYLSSSDF AAGQRATASI TPVSAWRSEI DKYTVQLKEQ 
DSSSIKKQPT KHQLQEEAAR EKQLLKRESF KRQLREWNDP EILHQNEKEF MKDPYRTIFV 
SRLDFSLTEL DISKHFSKYG VIESVRIIRD SVTGKSRGYG FIVFEREWDA QSCISEVART 
GVRLPQAKRT ILVDIERGRI VSNWRPRRLG GGLGGRHYTR PDPRFNSTAS AAASGRSINI 
ANNPHIPSGH SGHRQQPSYY PPTQSTFKSY PKETEKKPEK SVKDKYAKYA AVSESSGGYR 
SVGETRSIRS IRQG