Gene PICST_65353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_65353
Symbol	ARP4
ID	4838049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	+
Start bp	34821
End bp	36360
Gene Length	1540 bp
Protein Length	494 aa
Translation table	12
GC content	46%
IMG OID	640389364
Product	actin-related protein
Protein accession	XP_001383280
Protein GI	150864457
COG category	[Z] Cytoskeleton
COG ID	[COG5277] Actin and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CAAACTGTTG CTATGTCCTC AACAGCTAAC AGCGCTTCAG TGTATGGTGG GGATGAGATC 
AACGCCATAG TGCTAGATCC AGGCTCGTAC CATACGCGGA TTGGGTACGC TGGAGATGAT 
TTCCCTAAGG TTATAACTTC CTCCTACTAC GCTTCTGCGT CGAATGAGCC AATGGAAGCC 
GAGAAGGAAG ACTCCAAAAT TGGTAGCAAG TCAACCAAGA GGATTTTTGG AGATGCCATC 
GATGTTCCTC GGTCGAATTA CAACGTTCAT CCCATACTCA AAGATTCAGT AATTGTTGAC 
TGGGATGCTG CTTTGGACCA ATACCACCAT TTCTTCAAGA ATGTAATGAA CGTCACGTAT 
GAAGAGCAGC CAGTGTTGAT CACAGAGCCC GTATGGGCAG AGCCAAAGTA TCGTCAGACT 
TTGGTGGAGA ATTTCTTTGA ATACTACGAT TTCCCAGCAT TATATTTGGC CAAGGCTCCA 
TCTTGTGTCT CTTTCCAACA GGGTAGACCG AACTGTTTGG TGGTGGATAT TGGCCATGAC 
TCTGTGAGTG TGACCCCTGT CATTGATGGT ATATGCATGA TGAAGAATAC CATGCGAACG 
CATTATGCTG GTCAGTTTTT GGTGGATCAA GTCCAAGACC ATCTAGCCAA GTACAAAGAT 
TTATCTGTAG AGGGTACTTA CAAAATCAAG TCAAAGACAC CTACAGTATA CCCTGAAAAT 
GCAGAGTTCA CCACAAGAAC GCTTCCTGAA GATATCACGG CGTCGTATGA TGAGTACCAG 
AAACTGAAAA TCTGGCACGA GTTCAGAGAA ACTATGCTAG AGGTCCCAGA GCGCAAACTA 
GCCAATAACA ACATGCAGCA GCTGGCCACC ATGAAGGAGT TCTACACTCT GGATGCCAAT 
ACCAGATTGT TTGAATTCCC TACTGGACAG TCGTTACTGT TGAACTATGA TAGGTTTGTG 
TTTGCGGATT CGATCTTTGA TCCTTCTATC TATAAATTTG CCAACCAAGA GTTGACCAGC 
AAGTATCCCC CCAACAACGG AGTTCTTTCG ATTAAGAGTA AGTATGACGA CTACAGACCA 
CTAAAGAGAG TGCGCAAGGC AGAGTCTAAC CAGTCCACGC CTCCGCCGGG TGACAGTCCT 
ACCAAGCCCA GCAAGAACGG CAAGCACGAA GTCCGAGGCT TGTCGCAGTT GATCACTCAT 
ACGTTGTCAA CCATTGACAT TGATCTACGC ACCTCAGTCG CACACAACAT TATTGTGACT 
GGTGGGGTTT CGTTGGTGCC TCAATTGACG GAAAGATTGT ACAACGAGTT GACCAACACC 
AATCCAGGGC TCAAAATCAG GTTACACGCT GTGGGAAATT CAACAGAAAG GTTGAACCAG 
GCATGGATCG GAGGCAGCGT TCTAGCATCG TTGGGAACGT TCCACCAGAT GTGGGTCAGC 
AAACATGAGT ACGAAGAGGC AGGGGCTGAA AGAATCTTGA ACCAGAGATT TAGATGAACT 
GTATGTATAG TAGATGTAAA ATCAATTTAA AAGTACCTTT

Protein sequence

MSSTANSASV YGGDEINAIV LDPGSYHTRI GYAGDDFPKV ITSSYYASAS NEPMEAEKED 
SKIGSKSTKR IFGDAIDVPR SNYNVHPILK DSVIVDWDAA LDQYHHFFKN VMNVTYEEQP 
VLITEPVWAE PKYRQTLVEN FFEYYDFPAL YLAKAPSCVS FQQGRPNCLV VDIGHDSVSV 
TPVIDGICMM KNTMRTHYAG QFLVDQVQDH LAKYKDLSVE GTYKIKSKTP TVYPENAEFT 
TRTLPEDITA SYDEYQKSKI WHEFRETMLE VPERKLANNN MQQSATMKEF YTSDANTRLF 
EFPTGQSLSL NYDRFVFADS IFDPSIYKFA NQELTSKYPP NNGVLSIKSK YDDYRPLKRV 
RKAESNQSTP PPGDSPTKPS KNGKHEVRGL SQLITHTLST IDIDLRTSVA HNIIVTGGVS 
LVPQLTERLY NELTNTNPGL KIRLHAVGNS TERLNQAWIG GSVLASLGTF HQMWVSKHEY 
EEAGAERILN QRFR