Gene PICST_29898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_29898
Symbol	RVB2
ID	4837476
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	1454719
End bp	1456269
Gene Length	1551 bp
Protein Length	484 aa
Translation table	12
GC content	44%
IMG OID	640388791
Product	transcriptional regulator
Protein accession	XP_001383047
Protein GI	126133044
COG category	[K] Transcription
COG ID	[COG1224] DNA helicase TIP49, TBP-interacting protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.287738
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.530711
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTACGTT TTTGTATCTA TGCTTGTGAA ACCACGAGTA TATGATGAAA TGCTCTGCGG 
ACTTTGAGTT CTGAATGGCT ACTAACTTTT TATTTATAGG CATCTACACC TACGATCACA 
ACCAAAGTCC AGACAAAGGA CTTGTCTGGG TTATCTCTTA TAGCTGCCCA CTCCCACATT 
TCGGGTCTAG GCTTGGACGA GAACTTGAAG CCAAAAGAAT CAGCTGAAGG GATGGTTGGA 
CAATTGAAAG CCAGAAAGGC GGCTGGCGTG ATTTTAAAGA TGATTCAGGC TGGTAAGATT 
GCTGGCCGTG CTGTGCTTAT TGCCGGGCCT CCATCTACTG GTAAGACTGC CATTGCTATG 
GGTTTGTCGC AGAGCTTAGG TACAGATGTT CCATTTACAG CAATAGCCGG TTCTGAAGTC 
TTTTCTTTAG AATTATCCAA GACTGAATCA TTGATACAAG CTTTCCGTAA ATCTATTGGT 
ATCAAGATCA AAGAAGAAAC AGAAATAATC GAAGGTGAAG TCGTCGAGAT CCAAATCGAC 
AGATCAATTA CCGGCGGTCA CAAGCAGGGA AAGTTGACCA TTAAGACGGC TGATATGGAG 
ACAATTTATG AGTTGGGTAA CAAGATGATT GAAGGCTTAA CTAAGGAAAA GGTATTGGCT 
GGAGATGTTA TTTCCATCGA CAAAGCTAGT GGTAAAATCA CCAAGTTAGG TAAATCATTC 
ACCAGGGCCA GAGACTACGA TGCTATGGGT CCAGAAACCA AGTTTGTCCA ATGTCCCGAA 
GGTGAGTTGC AGAAGAGAAA AGAAGTTGTC CATACTGTTT CGTTGCACGA GATAGACGTT 
ATAAATTCTA GACAACAGGG GTTCCTTGCC TTGTTCTCGG GTGACACTGG TGAGATCCGC 
TCTGAGGTTC GTGACCAAAT CAACACCAAA GTCGCCGAAT GGAAGGAAGA AGGTAAGGCC 
GAGATCGTGC CTGGTGTCTT ATTCATTGAT GAGGTTCACA TGTTGGATAT TGAGTGCTTT 
TCATTCATCA ATAGAGCATT GGAGGACGAC TTTGCACCCA TTGTTATCAT GGCCACTAAC 
CGAGGAATCA CCAGGACTCG TGGTACTAAC TACAAGTCCC CTCATGGCTT ACCTGTAGAT 
TTGTTGGACA GATCTATCAT CATCCACACT TCATCATACA GTGCCGACGA GATCAGAACC 
ATTCTTTCCA TAAGAGCCAA CGAAGAAGAA GTAGAATTGA CCCCTGATGC TTTGGCATTG 
TTGACCAAGA TTGGTCAAGA AACAAGCTTG AGATACGCCT CTAACTTGAT TTCAGTTTCC 
CAACAGATTG CATTGAAGAG AAGAAGCACT TCTGTTGAGC TTCCAGATAT CAAGAGAGCA 
TACATGTTGT TTTTGGATGC TGACAGATCG GTACAATACT TGGAAGAGTT CCCAAACCAA 
TTCATCGACA ATTCTGGTAA TGTTACAATT GGCCAGAAGG ATGAGTCTTC GGCCAATGGC 
AACGGCGCTA CTCCTATTGT TGTAGATGAA GACAAGATGG AGACCGATTA G

Protein sequence

MASTPTITTK VQTKDLSGLS LIAAHSHISG LGLDENLKPK ESAEGMVGQL KARKAAGVIL 
KMIQAGKIAG RAVLIAGPPS TGKTAIAMGL SQSLGTDVPF TAIAGSEVFS LELSKTESLI 
QAFRKSIGIK IKEETEIIEG EVVEIQIDRS ITGGHKQGKL TIKTADMETI YELGNKMIEG 
LTKEKVLAGD VISIDKASGK ITKLGKSFTR ARDYDAMGPE TKFVQCPEGE LQKRKEVVHT 
VSLHEIDVIN SRQQGFLALF SGDTGEIRSE VRDQINTKVA EWKEEGKAEI VPGVLFIDEV 
HMLDIECFSF INRALEDDFA PIVIMATNRG ITRTRGTNYK SPHGLPVDLL DRSIIIHTSS 
YSADEIRTIL SIRANEEEVE LTPDALALLT KIGQETSLRY ASNLISVSQQ IALKRRSTSV 
ELPDIKRAYM LFLDADRSVQ YLEEFPNQFI DNSGNVTIGQ KDESSANGNG ATPIVVDEDK 
METD