Gene OSTLU_119616 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_119616
Symbol	Rpb3
ID	5000477
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009356
Strand	+
Start bp	650476
End bp	651484
Gene Length	1009 bp
Protein Length	318 aa
Translation table
GC content	46%
IMG OID	640415898
Product	DNA-directed RNA polymerase II subunit 3
Protein accession	XP_001416207
Protein GI	145342475
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.67705
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCCGG GGGAAGAAAC CGGTGCTTCA GTGACAGTGG CACGTTTAGA GGACGAAACT 
ATCATTTTCG ATTTGAAAGG AGTTGATGTC AGCCTAGCAA ACGCACTCAG GCGGCTAATG 
ATAGCGGATG TCCCAACTGT TTCAATTGAC TTAGTCGAGG TGATAGAAAA CTCCTCTGTT 
CTGTGTGATG AGTTCTTGGC ACACCGCTTG GGTCTGATCC CCCTTGACAG CACAAAAGCT 
TCAGAACTCG TGAAGCCTTA CGAGTACACT GGAGACGATG ATACCGCAAC AGATGTGCAC 
TTGGAACTCA ATGTGCGATG TCAGAGCGAC CAGACAAGGG ACGTCACGAG CGACGATCTG 
ATCTCACACG ACGAAAGAGT AAAACCAGTG AGCTTTGGGG GGACAGGTGG TGGTTCTGCG 
AAGTCAGGCG GGATTCTGAT AGCAAAACTA CGCAAAAACC AGCAGTTATC GTTGAAATGT 
ATCGCAAGAA AAGGCACTGG TAAGGATCAT GCCAAGTGGT CCCCAGTCGC TACGGCCGTG 
TTTAAGTACA CTCCCTTGAT TGACATCAAT CACGGCCTCC TGAACTCGCT AAATGGTAAG 
AGCCAGACTA GAATTCTTTA CCACAACTTT AAACGTCACA ATGCAGGACC GGAAAAGGCA 
GCGATCGTGG AGAGCGATCC ATCCAAAATG TTTAAATATG ACGCCGACAC GGATACTTTT 
ACTCTCACCT CTCCAGAGTC ATGTACTTAC GATGGTGAAG TTATGAAGAA GGTAAGATTC 
AACATTCGTT TCATCTATAT AAATGAACTC TTGACCTTGA CAGGTAAACG AGCTCGGAAA 
GCCTGGATTG ATTGATGTGC GGCCCGGTCT GGACTGTTTT ACTTTCATCG TTGAGTCAAC 
TGGAGTATTG AAAGTTGAGG AGGTTGTTCT ACAGGCAGTG CATATTTTAC AAAGTAAACT 
GGATACTATA GGAGTAAGTT CGTGTTTTGA CAAATTAGAA ATTCAATAA

Protein sequence

MIPGEETGAS VTVARLEDET IIFDLKGVDV SLANALRRLM IADVPTVSID LVEVIENSSV 
LCDEFLAHRL GLIPLDSTKA SELVKPYEYT GDDDTATDVH LELNVRCQSD QTRDVTSDDL 
ISHDERVKPV SFGGTGGGSA KSGGILIAKL RKNQQLSLKC IARKGTGKDH AKWSPVATAV 
FKYTPLIDIN HGLLNSLNGK SQTRILYHNF KRHNAGPEKA AIVESDPSKM FKYDADTDTF 
TLTSPESCTY DGEVMKKVNE LGKPGLIDVR PGLDCFTFIV ESTGVLKVEE VVLQAVHILQ 
SKLDTIGVSS CFDKLEIQ