Gene OSTLU_33760 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_33760
Symbol
ID	5006382
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009372
Strand	-
Start bp	53214
End bp	54860
Gene Length	1647 bp
Protein Length	548 aa
Translation table
GC content	43%
IMG OID	640421803
Product	predicted protein
Protein accession	XP_001422325
Protein GI	145356204
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.125053
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000000675839
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGAGGTCA GTATTGTTGA AGCCGGAGAT GCAAATATTT GTGGATCCAA ATGGGTAGAT 
AAGGTAAAAC CAGATGGTTC CCTTAAGTCT AGATTGGTAG TGCAAGGATT CACCCAAGTT 
TGGTTGAAGG ACTACCACGA CACATTTAGT GCCGTTGCTT CCATGACCAC ATTTAGGATA 
CTCATAAACT TGGCGGCGAT ATTAGGATGG GACATCTTTA CGATAGATGT ATCCCAAGCT 
TACACGCAAG GGGAACTCCT AGATGATATA TACGTCAAGG CCCCAAGGTC ACATCCGCTT 
CCGAAAGGAA TGGTCTACAA GTTACGCAGA CCCTTGTATG GCACAAAGCA AGCGGGACGG 
TGTTGGTATT TGCATGTAAC CAAGACTCTA AGGTCTCTGG GTTTGAACCA ATTATGTAAG 
GATAGCTGTT TGTTTGTTAA GATGAGCAAT AGCAAGCCCT TCATGATCAT TTCAGTATTG 
GTAGATGATC TTCTGATAAC CGCTGAGAAC GATGAGGTTG TCAAGCAGTT CCACAAAGAA 
TTTTCCAGAA TTTACAAAGT TTCGCAATTT GAAAGGATAA AGGTGTACAA CGGCATCCAT 
ATAAAGAGAT TAGGGAAGAA TTGTTACACA CTCAACCAAG AATATTCAAT TGCGCAGTTT 
CTGGCAAAAT GTCCTGTGCA AGATATCAAT GCTTGCAATT CGCCATTACT ACCATCAGAT 
ACGTTTGTTC TCGCCAAGGA GGATGACACA GATGCAGTAG ACAGGATGAA GCGGACAACA 
TATCAACAAG TGCTGGGAAG TCTGAATTGG TTTAATACTG CTACTCGACC AGATCTTGCT 
GTGGTATGCA GTCTAGCTGG AAGGGTAGCA AGTAACCCAA CGCATAAGCA ATTTAGCGCT 
TTATGCAGAG CGGTTGGATA TCTCAAGAGG AACCCCAATA TTCCATTAAC CTACAACGGT 
GCTGAATGCA ATGGTATAGT GAGACTTGCA GGATTTACAG ACTCGGATTG GGCAGGCCAA 
AAGTTATCCT TAAATTCGAA AGATAGATGC GGAAGAAAAT CCACATCGGG GTATATATCT 
TTTTCATGCG GCCCTACCAA TTGGAAGAGC AAACTGCAAG GAATACCAGC CACGAGTTCA 
GCGCAAGCAG AGTTCATGGC AATGTATGAA GCCGCGAAAG ATTTATTCTT TCAAATTTTG 
TTGTTTCGAG AGCTTGGATT TAAACTGTCA AGAGTACCAC TCTTCTGCGA TAATACGACA 
GCCATTCGAC AGGCAATGGA AACTATGTCG TCTAAGTCAA ACAAGCATAT GGAAATAAGA 
TACTCCTGGA TCCAACATTA TGCTCACAGA GAAGGGATTA TACAGCCATT TAACATAGGA 
TCATCACACA ACTTAGCCGA TATGTTGACA AAGATATTGC CGAACAAGAA GAACTTTTCA 
GGTCCAGCAG ACGTTCACGA GTGTTCTAAT CACTTCAACG TGATGTTAAG TCATATATCT 
TCGAAGGACA TACGAGACTT CATCAACCAG AGGTTGAGTG AAGGTATGGT GAAGAGTGAC 
GCTCTGCACA CATTTCAAGA ATATCTCGAG AAGGTCGAAA GTGAGGAAAT CCAACCTTTC 
AAAGGTATTG GTAAGCCCTC AGACTAG

Protein sequence

MEVSIVEAGD ANICGSKWVD KVKPDGSLKS RLVVQGFTQV WLKDYHDTFS AVASMTTFRI 
LINLAAILGW DIFTIDVSQA YTQGELLDDI YVKAPRSHPL PKGMVYKLRR PLYGTKQAGR 
CWYLHVTKTL RSLGLNQLCK DSCLFVKMSN SKPFMIISVL VDDLLITAEN DEVVKQFHKE 
FSRIYKVSQF ERIKVYNGIH IKRLGKNCYT LNQEYSIAQF LAKCPVQDIN ACNSPLLPSD 
TFVLAKEDDT DAVDRMKRTT YQQVLGSLNW FNTATRPDLA VVCSLAGRVA SNPTHKQFSA 
LCRAVGYLKR NPNIPLTYNG AECNGIVRLA GFTDSDWAGQ KLSLNSKDRC GRKSTSGYIS 
FSCGPTNWKS KLQGIPATSS AQAEFMAMYE AAKDLFFQIL LFRELGFKLS RVPLFCDNTT 
AIRQAMETMS SKSNKHMEIR YSWIQHYAHR EGIIQPFNIG SSHNLADMLT KILPNKKNFS 
GPADVHECSN HFNVMLSHIS SKDIRDFINQ RLSEGMVKSD ALHTFQEYLE KVESEEIQPF 
KGIGKPSD