Gene OSTLU_24498 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_24498
Symbol
ID	5002065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009359
Strand	+
Start bp	43946
End bp	45462
Gene Length	1517 bp
Protein Length	490 aa
Translation table
GC content	58%
IMG OID	640417486
Product	predicted protein
Protein accession	XP_001417652
Protein GI	145346350
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0174559
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGTTCG CACCGTCGCT CGGTAACACC CAACGCGATT CGCGCTTCGG CGCATCGTCC 
ATCGACGCTA CCGAGCGAAC GGTGCGAGAG TATAAGGACG AATTGTCAAT CCTCTCGTGG 
TCGCACGATC GCGGATTCGA GACGCACAGA GGATCGTGGA GGCAGGAGGC GCGAAGCGCC 
GACGCGAACG AGACGCCGGA CGCGCCGGCG AAGGACGAGC GCGACGTGTC GAATCGTCAA 
CGAGGGGCGG CAACGCTGAT GGCGCAAACG ATCGCAAAGT ACATGCCTGG TCGATTATCG 
GAGACGTCGG CGCCGTTCGA GTTGTTGTAC TCGACGTGGG ACATGCCGTC GACGCCGTGC 
TTGGACGCCG AGTACGCGCA GAAGTTGTGC GAGTTTGATC GATGGGTACC TATATTTAAC 
TTTGGGAGCT CGTTCAAGGA TCAAACCGTG CTGCCGACAA TGGTGCCAGC CACGCTCGGC 
GCGCTTCGTA GTTGTTTCAT CGAGGGTTTG AATCCGCATT TAGGCTTTAG CGCGGACGAC 
GAGCCACAGT GCGACTTTTT ACGCTTCCCG ACGACAAAGT ATTCCGAGCA AGGAAAGTGC 
GACGCCAAGC TCGCTCAGTG TCGGTATCAC GGATTGTTTT CGCTCAATGC CGTGGATGAT 
AAGTCGATGT ACGAGTGGGA TAATCTCAAA CCGCAGGTGG AATGGCGCGG GAGCGACTAT 
TCGTTTCTCG CGCCCCGGGT ACCGGGGCAC AAGCCTGACG CGAATGAGTT TTTGAGCGAA 
ATCGCGTCTT CAGCCAATGT TTCGCAGGCC TTACACGATA TGGCGTTTTC CACCGATATT 
GGACCACGTC TCAGGGCGGT ACTGTTTTCA AAGTTGTACC CCGAGCTCAT CGACGCCAAG 
TTTTTCAACT GGAAAAATCA GTCGAGCGCG CGCGACAAGA TGGCCGCCGA ACTCGGTATT 
GACGCCACGG AACGCTTAAC TGAAGAGGCG CTGGGCAAAT ACAAGTATCA TCTCGACCTC 
GGCGGTGGTG GAGGGACGAC GTGGAGCGGA CTGATTCCCA AACTCACCAT GCCGGGCGTG 
CTGTTGCACC ACGAGACGTC GATGAAGGAT TCGTACTTTG ACACTCTGAA GCCGTGGGTG 
CACTACGTGC CCGTCGCAGA AGACCTACAC GACGTTTTTG AGAAGATTTC TTGGTGCGAA 
ACGCACCCCG AGGAAGCACG AAATATCAGC GCCAACGCCA ACGACTGGGT TCGCGACTTC 
CGAGGCTTGA AATCGCTGCT TCGTCACAAC TATCAAGCCC TGGCGATTCC CTTGGCGAAA 
ACGCTCGATC CCTCTGGCGA GACGCTGCTA GACTTTGAAG CCGCGCACGT GGCCGCGCGC 
GCCGAGCGCC TGGCCGCGCG CGCCGCAAAA CTCGCCATCA AAGCGTCCAG AGACGCCGCC 
AAAGCCGCGA AGGCCACCAA CGTTTCCGAT TAACCCCCGT TCCGCGCTGT ATCAACAGTA 
TCAACACCAT CCGTCCA

Protein sequence

MMFAPSLGNT QRDSRFGASS IDATERTVRE YKDELSILSW SHDRGFETHR GSWRQEARSA 
DANETPDAPA KDERDVSNRQ RGAATLMAQT IAKYMPGRLS ETSAPFELLY STWDMPSTPC 
LDAEYAQKLC EFDRWVPIFN FGSSFKDQTV LPTMVPATLG ALRSCFIEGL NPHLGFSADD 
EPQCDFLRFP TTKYSEQGKC DAKLAQCRYH GLFSLNAVDD KSMYEWDNLK PQVEWRGSDY 
SFLAPRVPGH KPDANEFLSE IASSANVSQA LHDMAFSTDI GPRLRAVLFS KLYPELIDAK 
FFNWKNQSSA RDKMAAELGI DATERLTEEA LGKYKYHLDL GGGGGTTWSG LIPKLTMPGV 
LLHHETSMKD SYFDTLKPWV HYVPVAEDLH DVFEKISWCE THPEEARNIS ANANDWVRDF 
RGLKSLLRHN YQALAIPLAK TLDPSGETLL DFEAAHVAAR AERLAARAAK LAIKASRDAA 
KAAKATNVSD