Gene OSTLU_119509 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_119509
Symbol	Ogd
ID	5000410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009356
Strand	+
Start bp	461185
End bp	462744
Gene Length	1560 bp
Protein Length	519 aa
Translation table
GC content	46%
IMG OID	640415831
Product	hypothetical protein
Protein accession	XP_001416153
Protein GI	145342144
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG3751] Predicted proline hydroxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.557592
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACGATG ACATCTGTTC TCGAAGTTTC CTTGAATTCT CGTCACGAAT TACTTCGCCC 
ATTGTGAACG CTGTCCCGTA TCCTCACGTC AACATCCATA ACGTTTTTAA CGACCGCTTC 
CTTCGCGAGT GTTTGGCAGA ACTCAAAGAC CAGCTGACAG CAAATTTCAA AGAGACTGAC 
CTGTTCAAAG TATATCAAAC AACAGATCTA GCTAACTTAC AGGACTGTGT GCCACGAGCA 
CGCGTGACCG TACCGCATTT ATTCAGGCTT CGACAGTATT TGTATTCAGA GGCCTTCCGT 
GATTTCATCG TTCAGGCGAC AGGATGTGGT TCACTTGACG GCGCAGTGGA CTGCTCTTGT 
AATATTTACA CAGCTGGATG TCATCTGCTG TGCCATGATG ATGTGATCGG TACTCGGAGA 
ATTTCATATA TAATCTACCT TTCTGAACCA GACGAGGTTT GGACGGGTAC AGACGGAGGA 
CAATTGGAGC TGTATCCCAT CGGCCCAGAT GGAAAAAATC CAACCGACAG TCCCGTGGTG 
TCGATGATGC CGGAATGGAA TTCCATGGTT CTATTCGAGG TCTTGCCTGG ACACAGTTTT 
CATGCTGTTC GGGAGGTGAG TTCGATTACA AAAACCAGGG TCAGCATATC AGGGTGGTTC 
CACGCAAAGC AGATAAAACA AGCTGAAAAA CGCTATGGTG CTCCATCAAC ACTTCAACAG 
CTTCAGGCAG CTGGCGATAT CTACTATCCA CCGTACACTT CAGTTTCAAT TGCAGCTCGG 
TCTAGCCGAC AAATAGCAGA ACACGAACTG TCAAGTTTTT TGCACAAATG GGTCAAACCA 
GAATATCTGA TACACGAAAA CATTATACGA ATTCGAGAGC ACTTTCAAAA CGAAGGTTCA 
ATTCAGCTTC ACGACTTTCT CTTGCCAAGT ATTGCAGATT CGTTGCGTGA AAAGTTAAAA 
CGCGAAGACA GCCGCAACCG TCGAAAATGT GGCCAGTACG ACTACGCATG TGGGCATGGT 
TGGAGTGTGA AAGGTCCGCC TCATATTCGT AGGTATTTAA GTTATCAGCC TGATAGTGCG 
CGTACGAATA GAAATGATGT AGGTGATCGC TTGGAGGAAG TTCTGATTAA TGTCACCAGC 
ACAGTTGGAT TCCAGAACTG GTTGAGCGCG GTCACCGGTT TTCACTGCAC ACACGCATTT 
TCTGAAATAC GCCGGTTCCG AGCGGGACTG GACTACACGC TCGCGCACTC TGACATTTTC 
AAGGATTCTC AGATAGATGT CGATCTATGC TTTACGAGTG GTCCTTCTCA GTGGCTCTCT 
GGTGACTTAG GGGGCTATCA ATGCTTTACT TCCACTGAAG CAACGGACGG TGCTGCAGAC 
GTATACTCTG GGGACATTGC AGAGAACGAG TCTCTGCGAT CTATCGCACC TACATTCAAC 
AGTTTAACAC TCGTAAAAGT GGATAAAGGC ATTACTAATT TTGTCAAATT CATTTCAACA 
CATGCGAAGG GAAGTCGTTG GGACATAACT TCTCGTTTTG TAGTGGCCAA GTCAACCTAG

Protein sequence

MHDDICSRSF LEFSSRITSP IVNAVPYPHV NIHNVFNDRF LRECLAELKD QLTANFKETD 
LFKVYQTTDL ANLQDCVPRA RVTVPHLFRL RQYLYSEAFR DFIVQATGCG SLDGAVDCSC 
NIYTAGCHLL CHDDVIGTRR ISYIIYLSEP DEVWTGTDGG QLELYPIGPD GKNPTDSPVV 
SMMPEWNSMV LFEVLPGHSF HAVREVSSIT KTRVSISGWF HAKQIKQAEK RYGAPSTLQQ 
LQAAGDIYYP PYTSVSIAAR SSRQIAEHEL SSFLHKWVKP EYLIHENIIR IREHFQNEGS 
IQLHDFLLPS IADSLREKLK REDSRNRRKC GQYDYACGHG WSVKGPPHIR RYLSYQPDSA 
RTNRNDVGDR LEEVLINVTS TVGFQNWLSA VTGFHCTHAF SEIRRFRAGL DYTLAHSDIF 
KDSQIDVDLC FTSGPSQWLS GDLGGYQCFT STEATDGAAD VYSGDIAENE SLRSIAPTFN 
SLTLVKVDKG ITNFVKFIST HAKGSRWDIT SRFVVAKST