Gene OSTLU_31850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_31850
Symbol	lhca5
ID	5001723
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009359
Strand	+
Start bp	639957
End bp	641043
Gene Length	1087 bp
Protein Length	185 aa
Translation table
GC content	63%
IMG OID	640417144
Product	chlorophyll a/b binding, possibly photosystem I light harvesting complex
Protein accession	XP_001417828
Protein GI	145346713
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.719224
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.42101
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATCGCACGTC ACGCACGCAC ACCCAGCGCA CGACACGCAC CGTCTCGTTC GTCGCACGCA 
TTTAACACAG CCATGATCGC ACAACGCGCG TCCACGACGC GAACGATCGC GACGCCGACG 
CGCGCGACCG AAGCGCGACG CGCGCGCGTC GTCGCGAACG CGGCGGACCG AAAGATGTGG 
TGCGTACGAA CGGAAGCGCG GATGGGGGAA TCGGAAGGAA GAATTACGTC GCGGGCGAAC 
GCGCGAGCGT CGCGCGCGCG CGACGCGTCG CGCGACGCGT CGATGCGCGC GCGATGGCAT 
CGGACGTATC CGAGATACGG GATATCTGAT ATGGCGCGCC GCGCGCGATC GGGCGACGAC 
GGTTGGGAGG GCGAATCGGT CGCGCGACGC GCGAGTGACG CGCGGGTGGC GATGCGAATG 
ATGATACTGA CGGAATGATT CGATGCTTAC GCGCGATGTA GGTTGCCCGC ACCGTACAAG 
GCGCCGGCGC ACCTCGACGG CACCGTCGCC GGGGACTACG GCTTCGATCC TCTCGGCTTG 
GGCAGCGACC CGACGCGCCT CAAGTATTAC CAAGAGGCGG AGCTCATGAA CGCTCGATGG 
GCGATGATGG CTGTTGCGGG TATTGTCGGT ACCGAAATCG CGGGCATCGA ACCGCGATGG 
TGGGAAGCCG GCACCGAGGA TTACGGATTC CCGCCGCAAG CGCTCCTCGC GGTGCAGCTT 
CCGGTGATGG GGTACCTCGA GAACAAGCGC ATTCAAGGTT GGTTGGCCAC CGGTTCGAGC 
GGTGTGAACG AAACCTTCCC GTTCGACCCG ATGGGCATGG GCTCTAAGGA CGAGAAGATG 
AAGCTCAAGG AGATCAAGAA CGGCCGCGCC GCCATGATCG CCTTCGTCGG CATCGTCGTG 
CAAGGCATCG TCTACCGCGA GGGCCCGGTC GCCGCGCTCA AGGATCACGT CGCCAACCCG 
TTCGGTTGCA ACATGGCGAC GAACATCATG AACATCCCGG TGAACTTGGC GTAAACTGAG 
CTACGACGTT TAACGGACGT ACGATTACGC CCGATGTGTA CACCGATCAG TCAACAAACA 
ACCACCC

Protein sequence

MWLPAPYKAP AHLDGTVAGD YGFDPLGLGS DPTRLKYYQE AELMNARWAM MAVAGIVGTE 
IAGIEPRWWE AGTEDYGFPP QALLAVQLPV MGYLENKRIQ GWLATGSSGV NETFPFDPMG 
MGSKDEKMKL KEIKNGRAAM IAFVGIVVQG IVYREGPVAA LKDHVANPFG CNMATNIMNI 
PVNLA