Gene OSTLU_785 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_785
Symbol
ID	5005919
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009370
Strand	-
Start bp	245610
End bp	248221
Gene Length	2612 bp
Protein Length	653 aa
Translation table
GC content	55%
IMG OID	640421340
Product	predicted protein
Protein accession	XP_001422016
Protein GI	145355534
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.357988
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0000475729
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

CCGATGGACC TGCTGACGCT GCAGAGCGCG TGTAAGCGCG ACCCGGAGGG ATACGAGGAG 
GATTTCGCGC TGCAGCTGCG ACACTACGAG GCGCTGCGCG CGCTCTTCGC GATGAAACCG 
TCGCGGGATC ATAAGGAATT CAGTGAGTTG GTGTCGTTCA TCGCGCACGT GAGCGTGGTG 
TATAAGGAAC AGACGAAAGG GTTCTCGAAA GGGGTGGTGG AGGTGCTGGA GCGACATTAC 
GCGATACTGG ACCCGCACTT GAGGAAGAAT TTGACGAGCG CGTTGATTTT ATTGAGGAAC 
AAGGGCGTGA TCGGTGTGGA GGTGACGCTG CCGTTGTTTT TTAAACTGTT CCGGGTGAAG 
GACAAAAATC TGCGGGTGCT GATGTTCAGA CACATCGTGA GCGACGCGAA GGCGGCGAAT 
AAGAAGAGGA CGGATGACAA GTATAATCGC ACGGTGCAGT CGTTTTTGCA CACGGCGATA 
AAGGATGAGA ACGAAGCCAC GGCGAAGAAG GCGCTCGCGG TGCTGACGGA GATGTACCGG 
AGAAATATAT GGACCGACGC GAAAACGGTC AACTTGGTGG TGGAGGCGTG CAAGCATCCA 
TCGCAAAAGA TCTTAATCGC CGCGTTGAAG TTTTTTGAAG GTCAAGACGA AGCCGCCGAG 
GCGGCAGCCG AAGCTGGGGA TGGGAGCGAT TCCGACGACG ATCCGTCGAC TCGCGAATCG 
GAGATTAAAT CGCGCACGCA GGTTTCCAAG GAAGACGTTT TCAAGGCGTA CAAGACGGTG 
CGTGGTGCCT CACATTTTCA ACGCTCTTTT TTTTCAAACA CGACGACGTG CAAGCCGATG 
ATGTTCAAAT ATATTTGCTA CTCTCGAGGC TCGACAGTGA CGACAATCAA TCACCAAGAT 
CTCTGAGGCT TTTCTCGCGA CGTTCGTTTG CTCTTTTCTT TGCGCCGCGA GCGAGTGTTC 
GAAATACTGA CGAAAATTGT CTCGCTCGTT TCTTCCGATC GCGCAGGGCG TCGCCTCGTC 
TAAGAAGAAG AAGCAGAAGA AGCTAAAGCG GACGATTAAG ACTATGCAGC GCAAAGAACG 
CAACGCGGAC AAAGCGATTG ATTCTCGGTT CGCCGCGATG CAGCTCATCA ACGATCCGCA 
AGCGTTTGCT GAGTTGCTGT TCGGAAAGCT TCAAGTCGGG CACATGTCGT ACGACACGAA 
GATGCTGTGC ATCCTCATGA TGTGTCGCAT CATCGGCATG CATCAACTCA TCATGCTCAA 
TGTGTATCCA TTTTTGCAGC GCTATATTCA ACCGAGTCAG CTGGAGGTAC GCATTGATTC 
ATCGAGCGCT CGACGACGCG CCGCCCGCTC GCGAATGACG ACACAACTCA AGGCCAAGGG 
CATTCCAAAT ATGACCCATA CCAACGCCTC CGCTTAGTAC CTGACGCGAA CGCATCGAGC 
GGTTACGTTT ACGCATAATC GAATGCGCGA CTGACGTTTG ATTTCCATCA TTTACGCAGG 
TGACGAGACT TCTCGCCGCC GCCGCGACGG CGTGCCACGA ACTCGTGCCG CCGGACGCGC 
TCGCGCCGAT GTTGCGTCAG CTCGTCAACC AGTTCATTCA CGATCGCGCG CGCCCTGAAA 
TTGCCGCGGT TGGTTTGAAC GCGGTGCGTG AAATTTGTGC GCGCTGTCCT TTGGTGATGG 
ATGAAGATTT ACTTCAAGAT TTGACGCAAT ACAAAAAATC GCGCGACAAG CCGGTGTCAA 
ACGCAGCGCG AGGACTCATC GCTTTATTCC GAGAAATTGC GCCCGGCCTC CTCGACAAGA 
AGGATCGTGG GAAAGCGGCG GATATGTCAA GAACGCTCAA GGGTTTCGGT GAAGCTGAAG 
TGGTGGGTCG CATCGACGGC GTCGACTTGC TTCAACGCGA CATTTTGAAA CGTAAACGCG 
AAGAGGAAGC CGTCGAAATG TCTTCAGAGG AAGAGTATTC CGACGAAGAC GAAGACGAAG 
ACGAAGACAA CGAAGAAGAA GAGGAAGAGG ACGAAGAAGA AGAAGAAGAC GCGGACGAAG 
AAGAAGAAGA CGAGGTAGAG CCGCCAGCGA TTGGCAAACG CGGACGCGAG AGTGACGAAG 
AAGCGTCCAT CGATCCCGAC GCGCCGCCGC CAAAGATTCG TAAGAATGGC AAGTTGTCGC 
TCGCCGAACT CAAGCGTCGC CACAAGGCAA TGATGCAGAG GCGTAAAGAA GAGGAAGAAG 
CCGAGGTGCG CGCCGAGCAA GAGGCCGAGG AAGCCGAACT GGGTGGACCG GTGGAGCAAG 
AGCGCATTCT CACCGACGAG GATTTCAAGC GCATCAAGGC GCTCAAAACG GAGCGGCAAC 
TCAACGCCGC GCTCTCCAAG GCGGGCGCGA TGAAGGCTTC GAACGTCGCG ACCGATCACA 
TTCGATTAAT GCTTCGCAAG GCGGATCGCG CGAGTGATCG TCGGGTGAAC CCTGATTCGC 
TCGCCGCGAC GGGCTTGAAG AAGGCGCACG ACAAGGCGTC GCGTCTCGCC ACCGTCCTCG 
CCGGTCGCGA GGACAACGAG TACGGCGCGT CGAGCGCGCG CAAACAAAAG AAGACTGGCG 
GTTCGAGCAA CAAGGAGAAG GACAAGAAGA AA

Protein sequence

PMDLLTLQSA CKRDPEGYEE DFALQLRHYE ALRALFAMKP SRDHKEFSEL VSFIAHVSVV 
YKEQTKGFSK GVVEVLERHY AILDPHLRKN LTSALILLRN KGVIGVEVTL PLFFKLFRVK 
DKNLRVLMFR HIVSDAKAAN KKRTDDKYNR TVQSFLHTAI KDENEATAKK ALAVLTEMYR 
RNIWTDAKTV NLVVEACKHP SQKILIAALK FFEGQDEAAE AAAEAGDGSD SDDDPSTRES 
EIKSRTQGVA SSKKKKQKKL KRTIKTMQRK ERNADKAIDS RFAAMQLIND PQAFAELLFG 
KLQVGHMSYD TKMLCILMMC RIIGMHQLIM LNVYPFLQRY IQPSQLEVTR LLAAAATACH 
ELVPPDALAP MLRQLVNQFI HDRARPEIAA VGLNAVREIC ARCPLVMDED LLQDLTQYKK 
SRDKPVSNAA RGLIALFREI APGLLDKKDR GKAADMSRTL KGFGEAEVVG RIDGVDLLQR 
DILKRKREEE AVEMSSEEEY SDEDEDEDED NEEEEEEDEE EEEDADEEEE DEEAELGGPV 
EQERILTDED FKRIKALKTE RQLNAALSKA GAMKASNVAT DHIRLMLRKA DRASDRRVNP 
DSLAATGLKK AHDKASRLAT VLAGREDNEY GASSARKQKK TGGSSNKEKD KKK