Gene OSTLU_12848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_12848
Symbol
ID	5003707
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	+
Start bp	16072
End bp	17220
Gene Length	1149 bp
Protein Length	220 aa
Translation table
GC content	63%
IMG OID	640419128
Product	predicted protein
Protein accession	XP_001419466
Protein GI	145350122
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0450] Peroxiredoxin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	64
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGACG CGCGCGCGCG CGTCCGGAGC GCCTCGTCGC CGCGAGCGCG CGGTGCGGTG 
GTGAAGGTGA AGGTGAATGC GCGTGCGGTG TGCGTGCGAT AACGTCAATC GGGCGTGCGT 
CGCCGTCGTG TCGGTGTCCT CGGAGTGCGG TCGTCGTCCG TCGCAAGATT AAGATTGATT 
TCCAGGTGTT GGCCGCGCGC GTCGAAAATC GGATTTCCCC GACCGCGCGG TCGGCGATCG 
ACGTCGACGC GACGTCACTT TCGAGACGAC GACGACGACG ATGGCGAGCG CGATGACGAG 
CACCTCTGCG TTCACCCCGA CCACGGCGGG GCTGAAGGCG CGGCGCGCGA ACAAAAACTT 
CTCGCGATCG ACCGTTCGCG TGGTGCGCGC GAGGCGAGGC GAAGCGACGA CGGACGACGA 
CGGCGCGAAC GACGATGCGA TCGGGGAAGG ATAAAGAAGC CCGCGCGAAC GGTCGAGCCG 
GCCGAGGATC GCGGAGGGAG GCCGCGAGGA CACGGGCGAA GACTGACGAT CACCGTTACC 
ACGATTTCCG ACTCGCAGCA AGCGCGCAAG CCGTTGGTCG GGTACGAAGC GCCGGACTTC 
AGCGCCGAAG CCGTCTTCGA CCAAGAGTTC CAAGACATCA AGCTCAGCGA TTACCGAGGC 
AAGTACGTGG TGTTGTTCTT CTACCCGCTC GATTTCACCT TTGTGTGCCC GACGGAAATC 
ACCGCGTTCT CTGATCGTTA CGAAGAGTTC GCCAAGCTCA ACACCGAAGT TCTCGGCTGC 
AGCGTCGACT CCAAGTTTTC CCACTTGGCG TGGTTGCAAA CGGACCGCAA CGACGGCGGT 
CTCGGCGACT TGGCGTACCC GCTCGTGAGC GACCTTAAGC GCGAAATCAC CGAGGCTTAC 
GACGTCCTTT ACGAAGACGG CACCGCGCTC CGTGGTTTGT ACATCATCGA TCGCGAAGGC 
GTCATTCAGC ACAGCACCGT CAACAACGCT CCGTTTGGCC GCTCCGTCGA CGAAACGCTG 
CGCGTGCTTC AAGCCATCCA GCACGTGCAA AACAACCCGG ATGAAGTCTG CCCGGCGGGC 
TGGACCCCGG GTGCGGCGAC GATGAAGCCG GATCCGAAGG GTTCCAAGGA ATACTTCAAG 
GCCATCTAA

Protein sequence

MRDARARVRS ASSPRARGAV VKVKQARKPL VGYEAPDFSA EAVFDQEFQD IKLSDYRGKY 
VVLFFYPLDF TFVCPTEITA FSDRYEEFAK LNTEVLGCSV DSKFSHLAWL QTDRNDGGLG 
DLAYPLVSDL KREITEAYDV LYEDGTALRG LYIIDREGVI QHSTVNNAPF GRSVDETLRV 
LQAIQHVQNN PDEVCPAGWT PGAATMKPDP KGSKEYFKAI