Gene OSTLU_41114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_41114
Symbol
ID	5002577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009360
Strand	+
Start bp	234832
End bp	235752
Gene Length	921 bp
Protein Length	306 aa
Translation table
GC content	53%
IMG OID	640417998
Product	predicted protein
Protein accession	XP_001418189
Protein GI	145347473
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.830125
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGCTTGGTGA AGCCTTTGCA AGATTTCGGC TTTGGGCGCA CGCGCTTGTG GGAAGGAGGC 
GTTGGGTTAT TTATGATAAC TGGTGTCGCG CTTTCCTTCG TGATTTGGGG ATGGATCCAA 
GGCTTGCTGA GCTTTGCGCG CAAAAACTCG TATCAGGCAT TTATCGAGTT TCCGGTGGCG 
TGCGGGATCC AAGTCGGCAC GAATGTTCGA ATTCGTGGCG TCAAGGCTGG TTCCGTGCTG 
AGCGTGCAAC CGAGCTTGGA GAAGGTCGAA GTGCTTGTGG AGATGGACGA CAAGAACGTT 
CCCATACCTC GCAACTCTCT CATAGAGGCA AACCAAAGCG GTTTGATCGC AGAAACAATC 
ATTGACATCA CTCCCGCCAT CCCGATTCCA GTGGCTCAGT GGGGGCCTTT GGATTCTGGA 
TGTGAAGGTG AGGGCGTGAT CGTGTGTGAT CGGGGTAAGA TTAAGGGTCT GCCGGGGGTG 
AGCATGGACG AACTCGTCGG TATTTGTACG AAGCTCGCGA GAGAGATGGA AAGGCAAGAC 
GGCATGAACA AGATGTTCGA TACGACCGAC ACGGCTAGAC GACTGATGAC GACTTTGCAA 
CCGCTTCTTC GTGAGGCGGC GCAAATCGCC CAAGAGCTCC GACCGATGAT GCAAGGAGTG 
AACGAACAAG GCACTTTGGA CACGCTCGAA TCGCTCGCCG GTCAGACATC AGCCACCGTG 
GAAGACATCA GAAAGCTCAA GGATGCAATT TTGACCGAGG AGAATCAAGA ACTTCTTCGA 
CAATCCATTT CGACGCTCAC GAAGACGCTG CAACACGTCG AAAAGGTGAG CGGGGATATT 
AGTAGTGTGT CCGGTGATCC GAGCACTCGC GCAAACTTGC GACACTTGAT TCAATCGCTG 
TCGCGATTGG TTGACGCATA G

Protein sequence

RLVKPLQDFG FGRTRLWEGG VGLFMITGVA LSFVIWGWIQ GLLSFARKNS YQAFIEFPVA 
CGIQVGTNVR IRGVKAGSVL SVQPSLEKVE VLVEMDDKNV PIPRNSLIEA NQSGLIAETI 
IDITPAIPIP VAQWGPLDSG CEGEGVIVCD RGKIKGLPGV SMDELVGICT KLAREMERQD 
GMNKMFDTTD TARRLMTTLQ PLLREAAQIA QELRPMMQGV NEQGTLDTLE SLAGQTSATV 
EDIRKLKDAI LTEENQELLR QSISTLTKTL QHVEKVSGDI SSVSGDPSTR ANLRHLIQSL 
SRLVDA