Gene OSTLU_47343 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_47343
Symbol
ID	5005033
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009367
Strand	+
Start bp	173579
End bp	175705
Gene Length	2127 bp
Protein Length	363 aa
Translation table
GC content	69%
IMG OID	640420454
Product	predicted protein
Protein accession	XP_001420924
Protein GI	145353232
COG category	[R] General function prediction only
COG ID	[COG4447] Uncharacterized protein related to plant photosystem II stability/assembly factor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.0770421
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000226051
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

CTAATTCCTT CGCCCTCTCG TTCGCCCTCT CCAGCGCCTC CGCGTCCGTC GTCGACGTCG 
TCGTCCTCTT CGACGCCTCC GCCCGCGCCA GCGTCCTTCG CAGCGTCGCC CGCAGTTCGT 
CCCGCAGCGC GTCCCTTTCC GCCCTCGTCT TCGCCTCTCC CGCCGCCGCT CGATCCCTCG 
CTTCCTCCAT CTCCCTCGCC GTCGCTCGCG CCTCCTCCAG CGCGCGCTCG CGCGCCTCCA 
GCGCGCTCGT CAGTCGCCGC ACGTCCTCGT CCACGCTCGC GTACGCCTTG CTCAGCCGTC 
CCGCCTGCGC CGCCGCCGCG CGCGCGCGCT CCAGCCTCGC CTCGCTCGTC TCCAGCGCCG 
CGCGCATCCC CTCCAGCTCC CCGCGCAGGC CGTCCACCGT GTCGTCGAAC GCGCGCGCGT 
CGCCGGGCGA CGACGCGCCG CTCGCCGGCG CATCCATCGC GCCGCGGTGT GCCGTCGATC 
GATCGCTCGG CGCGCGCGCG CGTCGACCGC GCGAGGTTCG CGGCGCGCGC GCGATCGACG 
ACGCGAGGGT CGCGCGATCG CGCGTCGATC GATCGCGCGC GCGGCCGCGC GACCGCGTCG 
ATCGATCGCG CGCGCGCCGC GTCGATCGAT GCGTCGTCGA TCGACGCGCG CGCGCGATCG 
ACGACGCGGC GGTCGCGCGA TGGCGCGCGC GATCGATCGC GCGCGGTGGT GACGTCACCA 
CCGGGCGCGG CGGCGACGCG CCGGCGCGCG GCGCGGCGCG GCGCACACCG ACGCGCGCGC 
GCACGACCGC GCGCGATGAC GACGAGCGCG ACGGCGACGA CGGCGACGAC GGCGACGGCG 
CGACGCGCGA CGGCGCGCGC GCGCGACGCG GGGTCGAGAC GGGCGCGAGG GGGGGCGCGA 
TCGCGCGCGC GAGCGACGAC GCGGACGACG ACGGCGACGC GGGCGACGAC GGAGGGCGCG 
GGGGAGGACG CGAGCGCGGA GGGGAAGATG CCGCGACGCG CGCTGGCGGT GAAGACGGCG 
ACGCTCGTCG CGGCGCTGAG CGCGCTGCCG ATGGATAAGC GCGCGCTCGC CGAGGGTTCG 
ATCGAGAGCT CGTACTGGGA GCAAGTGGAG CTGCCGCTGG AGCCGGGAGT GATTCTGCTG 
GACATCGCGT TCAGTTCGAA CGATCCCAAG CACGGGTTCT TGCTCGGGAC GAGGCAGACG 
GTGCTCGAGA CGAAGGACGG AGGGAAGACG TGGGACGTGC GCGACTTGAG CGGATTGTTG 
GACGACGACG TGAATTATCG CTTTAATAGC GTGTCGTTTT GCGGCGACGA GGGATGGATC 
ATCGGTAAGC CGGCGGTGTT GTTGCACACG ACCGATGGTG GCGCGAACTG GGAGCGCGTC 
GGGTTGAGCC CGCGACTTCC GGGGGCGCCG GTGTTGATCA CGGCGGTGCA AGATAACGGC 
ACGGCTGAGA TGGTGACGGA CGAGGGGGCG ATTTACTTCA CCAAGGACGC GGCGCGCAAC 
TGGAAGGCTG CGGTCGAGGA GACCGTCTCC GCGACGTTGA ACCGCACGGT GAGCTCTGGT 
ATCACCGGCG CTTCGTATTA CACGGGCACG TTCTCCACGA TCTCGCGCAA CGACAACGGC 
GAGTACCTCG GTTTAAGCTC TCGCGGGAAC TTTTACATGT CTTGGGCGCC GGGTCAGGCG 
TACTGGCAAC CGCACAACAG AACGTCCGCG CGTCGGGTGC AAAGCATGGG CTGGCGCCCG 
GATGGCGGGA TTTGGGAGCT TACCCGCGGC GGTGGCATCT TCTTCTCCGC CGAAACCGGC 
CTCCCGGAGG AGGATTCTGA ATTCAACGAA GGTAGAATCG GCTCTCGCGG CTTTGGTCTG 
CTCGACTTGG GTTACACCCC GAGCGGCAAG ACGTTCTGGA CCGTGGGTGG CTCTGGAAGC 
GTGTTTTACT CTACCGACGC CGGTAAGTCA TGGAAGCGCG ACCGCGGCAC GGACAACGTC 
GCGGCGAACC TCTACAACGT CAAGTTCCAA AGCGAAGATC AAGGATTTAT TCTCGGCAAC 
GACGGTATTC TCTTGCGTTT CACCGGCGCC AAGTTGTAAC GGGCTGCCAC AATTGAGCAG 
CACCCCGCGT CGCGCGTGAA ATTGCAT

Protein sequence

MPRRALAVKT ATLVAALSAL PMDKRALAEG SIESSYWEQV ELPLEPGVIL LDIAFSSNDP 
KHGFLLGTRQ TVLETKDGGK TWDVRDLSGL LDDDVNYRFN SVSFCGDEGW IIGKPAVLLH 
TTDGGANWER VGLSPRLPGA PVLITAVQDN GTAEMVTDEG AIYFTKDAAR NWKAAVEETV 
SATLNRTVSS GITGASYYTG TFSTISRNDN GEYLGLSSRG NFYMSWAPGQ AYWQPHNRTS 
ARRVQSMGWR PDGGIWELTR GGGIFFSAET GLPEEDSEFN EGRIGSRGFG LLDLGYTPSG 
KTFWTVGGSG SVFYSTDAGK SWKRDRGTDN VAANLYNVKF QSEDQGFILG NDGILLRFTG 
AKL