Gene OSTLU_33476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_33476
Symbol
ID	5003660
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	+
Start bp	274583
End bp	276638
Gene Length	2056 bp
Protein Length	684 aa
Translation table
GC content	65%
IMG OID	640419081
Product	predicted protein
Protein accession	XP_001419543
Protein GI	145350285
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.2579
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.13386
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCGCC GCGCTCGCGA ACGCGACCGC GCGCGAAGCG CCGCGGCATC GCGCGTCGTC 
GCGCTCGCGC TCGCGCTCGC GGGCGCGGCG AACGCGCGCG CGCGCGCGGC GAACGCGGGC 
GGGGGCGGAC GACCGTCGTT CGAGGCGGCG GTGCTGCCGC CGAGCGCGTT CGCGGGACGG 
ACGAGCGCGG TGACGGTGCA CGGTTTGAAC TTTTTGCCGG GCCGGGACGC GGCGTGCGCG 
GATTGTAACG CGAACGGCGC CGCGACGACG CGGTGCGCGT TCGGAGACGC GAGGGATAAC 
GGTGCGGTGA GCGCGTTCGA TGGCTCGGAC GCGAGCGCGT TTGAGTGCGC GGTGAACGCG 
GTGGACGGGG CGACGGGGAC GCCGAGGCTG GGCTTCGCGC GCGGGAGTTG GAGCGCGAAC 
GGAGGGTACG ATTGGGCGGT GTTCGGGGGC GAGAGCGGGG GGGGGGAGGA TGGCAGCGTG 
CACTTCATGA AGATACCGAG CGTGGATGAC GTCATCGCGA GCGTGGCACC GATGGGAATG 
CCGACGTACG CGACGGGTGG AGATTTCGCG CGAGGCGCGC TCGGGTGTTA CTTTGAGTCC 
AGAAACGACG CGGGGTCGTG GGTGATGCGG GCGACGGGGA CGGCGGCGGA GGCGGCCGAA 
CACAGAGGGC TGTTTGTGAG CTCCGCGCTG TATCGATGCG AATCGCCGAC GTACGAGAGG 
ACGACGCCGT CCAAGGCGAC GCTGGCGCGG TTCGCCGTCG GCGTCTTGGG AAACGACGGC 
GGCTCGCTGA CGAATGTGGT GAGTTATAAG GAAAACTACT GGCTCACCCC GGGCGCGGCG 
ACCGTGAGTA GTGGGACGTA CGGTCTCACT GGGGGAGAGA CGATCAGCGT CGGAGTGAGC 
GATTCGGATG GAGATTGGGC AAACATCGGT TGTCTCGTGG GAACGACGCG CGTGAGCGCG 
CGGTCGGTGT CTACGTCCAC GGTGACGTGC GTAGCCCCTG CGCGCGCGGA GGATGATATT 
GCGAACGTGC CGATCATGGT TGGCGTACGG TATGCCGAAC AGAGCGCGTC GGTCGTGACG 
AGATCGACGG ACGTGACGAC GTACTCGGGC GGTACGCCAA AGCCGACGAG CCCGTACGAA 
CTCCTCAACG ACGAGTTATT CCTATTCGGT CGCGGGAAAC AAGTCATGCA AGTTTCTTCA 
GAAGAAGATT TCACGTGCGT GTTGACTACG GTTGTCGACA ACGTGACTTC GGTGTTCAAA 
TCGACGACGG CGAACGCGTC TCCCTTTGAC CAAATCTTAA ACTGTCTCCT TCCTTTGAAC 
GTCGAGGTGG GATTCGTGGC GATGGGCATC ACCGGTGGGA AATACGAGGG CGTGACGCAA 
GTCATGTTCG TCGATCCACC GCGGGCGATC AGCGCGTCGC CAAGACGAAG CCCGAGCGAA 
GGCGGTGGCA TCGTGTGGGT GTACGGCTCG AATTTGAACG CCGGCACCGA TCCGTACTCG 
TCGTGCGTGT TCACTGCCGA CGAGTCGTCG AGTTTCAAAT GGGCAGTGGG AACCGGCGCT 
CGCGCGAGTT CCGCTCTCGT CGCGTGCGAG CTACCGCCCG CGGCGTCCGT GGTGGTGCAG 
AACAATCAGC GAACAACGGC GGTGGCCGTC GTCATGCGTC CTGCTTCGGC GAGCGCGAAC 
GCCTTGGATT CGGGAGCTTC GATCGAGTAT GCCGTAAACG TCGCGTCGGC GTCCATATCT 
CCAGTGCGTG GATCGTTAGA AGGAGGGACA CCCGTGCGCC TGGATCCGAC TATGACGTGG 
GTCGTGTCGC AAAGCTCGTC GGGGACGCCA GATACGGATG ATTTCGGCAC GGGTGGGTGT 
CGCTTCAGCG CTGTCACCGT GTCCGCGCGC GTCGCCGACT CGGGAGCGAT CGAGTGCGTG 
TCACCGTCGC TAGGTAACTT TCCGTACGCC AACGCACCGG TCGCGATCGC GGTGGATTGG 
CGAACGAGCT CGTCGCCCCT CGTCTTCTTT ACGAGTACGA ACACGTTTCT CAACTTTTCA 
TACGTTCGAT TCTAGC

Protein sequence

MRRRARERDR ARSAAASRVV ALALALAGAA NARARAANAG GGGRPSFEAA VLPPSAFAGR 
TSAVTVHGLN FLPGRDAACA DCNANGAATT RCAFGDARDN GAVSAFDGSD ASAFECAVNA 
VDGATGTPRL GFARGSWSAN GGYDWAVFGG ESGGGEDGSV HFMKIPSVDD VIASVAPMGM 
PTYATGGDFA RGALGCYFES RNDAGSWVMR ATGTAAEAAE HRGLFVSSAL YRCESPTYER 
TTPSKATLAR FAVGVLGNDG GSLTNVVSYK ENYWLTPGAA TVSSGTYGLT GGETISVGVS 
DSDGDWANIG CLVGTTRVSA RSVSTSTVTC VAPARAEDDI ANVPIMVGVR YAEQSASVVT 
RSTDVTTYSG GTPKPTSPYE LLNDELFLFG RGKQVMQVSS EEDFTCVLTT VVDNVTSVFK 
STTANASPFD QILNCLLPLN VEVGFVAMGI TGGKYEGVTQ VMFVDPPRAI SASPRRSPSE 
GGGIVWVYGS NLNAGTDPYS SCVFTADESS SFKWAVGTGA RASSALVACE LPPAASVVVQ 
NNQRTTAVAV VMRPASASAN ALDSGASIEY AVNVASASIS PVRGSLEGGT PVRLDPTMTW 
VVSQSSSGTP DTDDFGTGGC RFSAVTVSAR VADSGAIECV SPSLGNFPYA NAPVAIAVDW 
RTSSSPLVFF TSTNTFLNFS YVRF