Gene OSTLU_16539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_16539
Symbol
ID	5003194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	+
Start bp	540975
End bp	542342
Gene Length	1368 bp
Protein Length	455 aa
Translation table
GC content	62%
IMG OID	640418615
Product	predicted protein
Protein accession	XP_001419193
Protein GI	145349549
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.220218
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGAGG GATGGCGGCT CGGGACGACG GTGCGGGCGT GCGCGGTGAT GGCGGTGGCG 
ATCGCGGGCG CGCGGGCGCG GGCGCGGGCG GTGGAGGGAG GGAAGGGACG CGACGCGCGC 
GACGCGGAGG CGAGCGGAGG CGAGGGCGAG GCGACGCGGG AGGAGGAGAC GGCGTCGACG 
ACGACGGTGT CGAGGAGCGG GAGCGTGCCG GAGTTTGATG AGGTGCGGGC GATGTATCAC 
GACGCGATGA ACACGCTGAG CACGCTGGAT GGGGATCAGG GGTACGACGT GGCGACGCGG 
GCGTTTGGGC GCATCGCGAA TCTGGCCAAG GAGAGGGGAG ATAAGAATTT GGAGTGCGAG 
GCGGCGTTGA TCGTGGCGGA GATCGAGATT AACTCGCTGC GGAGGATGTA TGCGGTGTAT 
GAGCGCGATG CCGTGCACGA TGGGATCGAT GCGTCGCAGT TTGAACGCAT CACGCAGACG 
ACGCTCAAGT TGGCGTACGA CAACGGCGAT AAGATTTCCG AGGCGCGCGC GCACTTGGCG 
GTTGGAGATT ACTATTCCAT GGCGGTGAAC GATCACGTGG CGGCGCTGGA GCACTACGGA 
CTCGCGCGCG AGTTCGCGCG CGATGAAGGA ATCTTGCCCG TCGAGACTGA GGCGTGTCGA 
AGGATGCGGT GGACGCAGAG CATTCGAGGC GACGTCGACG GCGCCGTGGC GCTCTCGCGC 
GAAGTCTTAC GACTCACGCG CGAGTACGTC GCGATGTTGA ATGACGAGAA GGAGTCCTCG 
AAAAGGGACG CGACAGTACC CCTGATGCTT CGTGAGCATT GGTACTTGGG TGGGTACGAA 
AATCAAGAGG TGTACGCGCT CAAGGAGCAC GGGTGCACGC TTCGCGGCGA GACGCGTTTG 
TTGTCGAGGC CGCTTGTTTT GGAAAAGTAC CAAGACGAAG CCGTGCGAAC GTTCGAGGAA 
GCGATAGCGA CGCTCGATTC GCACTGGAAG CGCAGCGAAA GCTCGTTCGA GACCGACGCG 
GAGGGCGCGG CGATAAAATT GAGTCTTTTG GCGCATCTCG GAGACATTTT AGACAACGAC 
CTCGAGCGCA CGCCAGAGAA CCACGCGTCT GCCGTCGAGT ACAGGAGAAC GTACAACGAA 
CTGAAACCAG GATCATTCGG CTCGAATGTC ACGTGCGCAC TGTGCGAAGA ACCGCTCGGC 
GGTCTATCCA TAGACGACGC GAGGATCCAG ATGACGTACG CCTGGGACGC GTGCGAATCC 
AGTCATCACT TCCATTCCGC GTGTCTCGAG GCGGCGTTCG ACGAGACGGC GCACGCGGGA 
TGTCCTGGAT GCAAGGCTGA AATCCAATCG ACGGCGACGT CAAATTAA

Protein sequence

MGEGWRLGTT VRACAVMAVA IAGARARARA VEGGKGRDAR DAEASGGEGE ATREEETAST 
TTVSRSGSVP EFDEVRAMYH DAMNTLSTLD GDQGYDVATR AFGRIANLAK ERGDKNLECE 
AALIVAEIEI NSLRRMYAVY ERDAVHDGID ASQFERITQT TLKLAYDNGD KISEARAHLA 
VGDYYSMAVN DHVAALEHYG LAREFARDEG ILPVETEACR RMRWTQSIRG DVDGAVALSR 
EVLRLTREYV AMLNDEKESS KRDATVPLML REHWYLGGYE NQEVYALKEH GCTLRGETRL 
LSRPLVLEKY QDEAVRTFEE AIATLDSHWK RSESSFETDA EGAAIKLSLL AHLGDILDND 
LERTPENHAS AVEYRRTYNE LKPGSFGSNV TCALCEEPLG GLSIDDARIQ MTYAWDACES 
SHHFHSACLE AAFDETAHAG CPGCKAEIQS TATSN