Gene PICST_39588 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_39588
Symbol	RRP1
ID	4851894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	3125678
End bp	3127345
Gene Length	1668 bp
Protein Length	556 aa
Translation table
GC content	42%
IMG OID	640393602
Product	Rhomboid-related protein 1 (RRP) (Rhomboid-like protein 1)
Protein accession	XP_001386926
Protein GI	126275943
COG category	[R] General function prediction only
COG ID	[COG0705] Uncharacterized membrane protein (homolog of Drosophila rhomboid)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0102742
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCAACG ACAACCATAA TAATCAACAC TACAATCTCA ACCTCGGCAA TAGTAGCAAT 
AAAAATAGCA ACAAAAACAA TAATAATGTC AGGAATATAC AAAAAATCAA CAGCAACTAT 
TCAGCCAACG AAGCGACCTA TCCCCATTCA ATCTTTACAG AGAACAACAC TCACGAACCT 
CCGGTAAACT CATTCCCATC TGGGACCCAG TATAGACCCA CACCTAAATT GGAAAAAGAG 
CTTCCGAATC CAAGAAACAA CGAATACGAG CTTTCAAACA TGGATGAATC CAATAATATC 
AGAAGATACT CATATACTCC GTATCTGGCG GAAACGTCTA ACTACAACAA CTATGACGAA 
ATAAGAGCTT ATAGCCCCAA TCCTTTTGCG GATAGAAACC TTGCACCACT TCCATCGATT 
CCTCACTCAG ATCCTTTTGA AGAGACACCG TTGGAAACCT CAAGCAACGA TCTCTTGAAA 
GATGAGTCTG ACAGCCATGA CAGACAGCAA TTTAACGAAA GAGAAAGAAT CAAGCTTTTG 
CGCAGAAAGC CGAGATTCCA CTATACGAGG CTTCCGTACT TCACGATTCT CGTGACTTTG 
ATCCAGGTAA TCGTCTTCAT TGTAGAATTG GCGCGTATGG CTCAATTAAC TGGTTCGGCA 
TTTCAAACCA AGCCTTACTT CAATCCGATG TTAGGTCCAT CTACATACCT CTTGATCTAT 
ATGGGTGCAA GATACGTTCC TTGTATGCTG CAGATTGTAG GAATCACGGA CGACACATCG 
ATCATGTTTC CCTGTGCAAA CTCGACCACA GTAGACACCA ATGTTTGCAA TTTGAGCGAG 
CTCTGTGGCT TGGGAGGTGT TCCTATTGTA GATAATAAGT TCATTCCAGA CCAATGGTAT 
CGTGTGATTA CACCTATCTT TTTGCACGCT GGGTTTCTTC ATATTATATT CAATCTTCTC 
TTACAGATCA CCATGGGTTC TTCCATAGAA CGTCATATTG GTGTACTCAA GTATGCTATC 
ATTTATCTCC TGAGTGGTAT AGCTGGTTTC TTGCTAGGAG CAAACTTCAC TCCACAAGGT 
ATCGCGTCCA CCGGAGCTTC AGGTGCCTTG TTTGGAATCG TCGCTACCAA CATATTGCTA 
TTCATATATT GTGGCAGAAA AAATACCAAT CTCTATGGAA CTCGCCATTA CGTCTTATTC 
ATCTGCATCA TGGTAGGCGA AATCATCATT TCTCTAGTTC TAGGTTTATT ACCTGGTCTT 
GATAACTTTA GTCATATTGG TGGGTTTGCT ATGGGTGTCT TGACAGCAGT TGTATTCTTG 
CCAGATCCCT TCTTTGTATA CATAGATGGT ATCATTACCT ACAAAGGAAA TGCAACCACA 
TGGGAACAGT TTGTGAACGC CTGGAACCCT TTCTATGCCT GGGAAGACAA AATCCCCTTA 
CGATTCTATA TTTGGTGCGG TTTTAGAGTC GTTTGTCTCG TACTTGCCAT AGTCTATCTC 
GCGATGTTGA TCAAGAACTT TTTTACTAAC ACTGAGTCAC CAGAATCTCG CTGTTCCTGG 
TGTAAGTACA TCAATTGTAT TCCTGTAAAT GGCTGGTGTG ACATTGGAGA AGTGACTATT 
ACTACATCTA CAGTTGCACA ACCTACTGCT ACTCCACCTC CTACAATG

Protein sequence

MFNDNHNNQH YNLNLGNSSN KNSNKNNNNV RNIQKINSNY SANEATYPHS IFTENNTHEP 
PVNSFPSGTQ YRPTPKLEKE LPNPRNNEYE LSNMDESNNI RRYSYTPYLA ETSNYNNYDE 
IRAYSPNPFA DRNLAPLPSI PHSDPFEETP LETSSNDLLK DESDSHDRQQ FNERERIKLL 
RRKPRFHYTR LPYFTILVTL IQVIVFIVEL ARMAQLTGSA FQTKPYFNPM LGPSTYLLIY 
MGARYVPCML QIVGITDDTS IMFPCANSTT VDTNVCNLSE LCGLGGVPIV DNKFIPDQWY 
RVITPIFLHA GFLHIIFNLL LQITMGSSIE RHIGVLKYAI IYLLSGIAGF LLGANFTPQG 
IASTGASGAL FGIVATNILL FIYCGRKNTN LYGTRHYVLF ICIMVGEIII SLVLGLLPGL 
DNFSHIGGFA MGVLTAVVFL PDPFFVYIDG IITYKGNATT WEQFVNAWNP FYAWEDKIPL 
RFYIWCGFRV VCLVLAIVYL AMLIKNFFTN TESPESRCSW CKYINCIPVN GWCDIGEVTI 
TTSTVAQPTA TPPPTM