Gene OSTLU_30781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_30781
Symbol	lhcp2.4
ID	5000601
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	+
Start bp	737460
End bp	738789
Gene Length	1330 bp
Protein Length	233 aa
Translation table
GC content	62%
IMG OID	640416022
Product	prasinophyte light harvesting complex, chlorophyll binding
Protein accession	XP_001416747
Protein GI	145344454
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.260173
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGGCATACCT GCACACGCAC ATTTCTACAA TGTCTGCCCT TCTCGCTTCC TCCTTCGTCG 
GCCGCGTCGC CGCCTTCAAG GCGACCAAGA TCCAAGTGCG TATTTTTTAG CCTTCGCGCG 
ACGCGCGACG ACGCGCGGGA CGACGACGCG CGCGAGGGAC GCGATCGCAT CGCGCGCCAT 
CGATCGACGG CGTGAGATAC GCGACATCGC GCGCGCGGCG CGCATCGCGT CGTCGCGACG 
CGGGACGTGC GACGCCGCGA AGGGCGTCGC GGGAAGCGAT GTCGATGATT ATTTGTGATC 
GCGACGCGAC GCGCGTCGGC GTCGCGACGC GTCGCGACGG GCGAGCGGGC GCTCGATCGC 
CGCGGCGATA GGATAACCGC GATACGGATA TTTTCTATCT GTTTGTTTGA CTGGACGAAG 
CGCGGGCGCG GGGCGGAGGA CGCGGGTGAT TGGATCGATC GTTCGAGCGA AGAGAGGAGA 
CTGACGAAAG AAACGCGATG TGTTTTACGA AATGAACAGG CCAAGTCTGT CTCCACGACG 
GTCAAGGCTG ACATCTACCC GGAATTCGGT ACCTACCCGG GCGGTGGCGA ATCCCCGATC 
ATCCCGTTCG GCGACGAAAA GAACGCCGAG CGTGAAGTGA TCCACGGCCG CTGGGCGATG 
CTTGGCGTCA CCGGTGCGTG GGCCGCCGAA AACGGCACCG GCATCCCGTG GTTCACCGCG 
GGTACCTTGT GCACCCCGGA TGACTGCACC GCCGTCGCGG ACAAGTTCCC GGGCGCCGTC 
GCCCCGCTCG CGCCGGAAGG CTCTGGCTAC CCGTCCTTCT GGAACGTTCT CATCATCGAG 
ATCGTTCTCG TCGGCGCCGC GGAAGCGTAC CGTACCGGTA TCTCCGACTC TCCGTTCGAT 
GATGGCCTCA CCGTCGGTGA CGTCAACCCG GGTGGACGCT TCGACCCGCT CGGCCTCGCC 
GAGTCTGGCG ACCTTGAAGA ACTCAAGATC AAGGAGCTCA AGCACTGCCG CTTGTCCATG 
TTCGCGTGGT TGGGCTGCAT CTTCCAAGCG CTCGCCACCC AAGAAGGCCC GATCGCCAAC 
TGGCAATCCC ACGTTGCGGA CCCGGTTCAC TCCAACGTCC TCACCAACGC GGCCAAGGGC 
TTCGGCTTCT ACTAAGCGGT TCACCGCCTT GGTAGCTTCG TCATAGGGTA GCTTGATCGG 
CGGCCGTCGA CTTCGCGTCT ACGGTCACCT CCAAGATTTC TCTGACAGCG CTGGGAATTC 
CCGACTGCTT TTGGGGCTTT GTCTCTTCAA TAACATTCGT TTTAATGATG CATCTCTCGA 
TGTTTGATTA

Protein sequence

MSALLASSFV GRVAAFKATK IQAKSVSTTV KADIYPEFGT YPGGGESPII PFGDEKNAER 
EVIHGRWAML GVTGAWAAEN GTGIPWFTAG TLCTPDDCTA VADKFPGAVA PLAPEGSGYP 
SFWNVLIIEI VLVGAAEAYR TGISDSPFDD GLTVGDVNPG GRFDPLGLAE SGDLEELKIK 
ELKHCRLSMF AWLGCIFQAL ATQEGPIANW QSHVADPVHS NVLTNAAKGF GFY