Gene OSTLU_29689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_29689
Symbol
ID	5006960
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009375
Strand	-
Start bp	120451
End bp	121988
Gene Length	1538 bp
Protein Length	420 aa
Translation table
GC content	64%
IMG OID	640422381
Product	predicted protein
Protein accession	XP_001422902
Protein GI	145357389
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	0.0208694
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00156333
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGCGACC TGACGTCGAC GGTGCGACGC GACGCGACGC GAGCGCGACG CGACGCGCGA 
CGGGAGACGA CGGGAGACGA CGGGCGGCGA CGCGACGAGC GGACGGCGAA CGCGAACGCG 
GCGACGCGGC GGCGGCAGGG TTTGCGCGAT CGCGACGGCG ACGCGGCGCG CGCGACGGCG 
GCGGACGCGC GAGGACGCGG GCGAAGAGTA ACGCATCGCG AACGCGTCGC GGACGCGAAG 
GGCCGACGCG CCGCGGTCGA GCGCGAGGAC TGACGGAGCG CGGGACGACG ACGCAGATCG 
CGGCGCGGCT GGACGCGCAC CTGACGCTGC CGCTGCTGGA GTTCGCGCTC GCGGAGGGCA 
CGCACGATGC GAAGTCGCTG CGAGAGGCGA AGCTGGCGAC GCTGGTGAAG ACGAAGATGT 
GCGATTGGGC GGAGGAGGCG CGCGCGGAGG CGAGCGGGTC GGGATCGGCG GCGGAGGCGA 
AGGCGAGGCG GGACGCGACG GTGGAGGCGC ACGCGGCGCT GGGGAAGGCG GCGGCGCGGG 
CGGTGAAGTT CGCGAGCGAT GGGGCGCTGA TCAAGAACTT GCGACGGGAT AAGGCGGCGA 
ACGCGAAGTT CGCGGAGGAT AATCACGGGG TGACGAGCGC GGACGTGGAC GCGCTGTACA 
AGTTTGCCAA GTTTGAGTAC GAGTGCGGCG ATTACGAAAA CGCCTCGGAG CACTTGGGCG 
CGGTGCAGTT GTTGAGCGCG GACAACGAGC GGTGCGAGAG CGCGCTGTGG GGGAAGTTCG 
CGGCGGACAT TTTGTTGCGG AACTGGGGCG GGGCTCTGGA CGACATGAAT AGGTTGCGAG 
ACGCGTTGGA GAGCAACGCG AGCACGAGCA ACCTCGTCAA GATGAAGCAG CGCGCGTGGT 
TGTTGCATTA CGCCCTGTTC GTCTTCTTCA ACCACCCGAA CGGTCGCAAC TTGATCATCG 
ACGTGTTGTT CCAGGAGCGA TACATGCAAG CGGTGCAACA AGAGGCGCCG CATTTGTTGC 
GTTACCTCGC CGTCGCCATC GTCGCCAACA AGAAGCGCCG CAACATGCTC AAAGACTTAG 
TGAAGATTAT CCAGAGCGAC GTGTACGACG ATCCCGCGCT CGACTTCGTC GTCGCGGCCT 
TCGTCGACTA CGACTTCTCC AAGACGCAAG AGATGCTGAA GAAGTGCGAC GCGATGATTG 
AAAAGGATTT CTTTTTAATC GGCTGCAAGG ACGCGTTTGA CGAAAACGCT CGACAGTACG 
TCATCGAAAA CTACTGCAAG GTGAACAAGC GCATCGACAT CGCCAACTTG GCGCAAATGC 
TCGGTATGCC CGCCGCCGAC GTCGAGGCCA CCATCGCGAC TCTCATCCGC GGCAGTAAGC 
TCAACGCGCG AATCGATTCC GAAGCCGGCT TCGTGCACGT GCACGTCGAG AAGAAATCCG 
TCAACGAGCA AATCATCGAA AAGACCAAAG CCTTGCTGTC CAAGACCACC GCCCTCACGC 
AAGCCGTGTT GGCCAACACC CAGGCGCAGG CGTATTAA

Protein sequence

MRDLTSTIAA RLDAHLTLPL LEFALAEGTH DAKSLREAKL ATLVKTKMCD WAEEARAEAS 
GSGSAAEAKA RRDATVEAHA ALGKAAARAV KFASDGALIK NLRRDKAANA KFAEDNHGVT 
SADVDALYKF AKFEYECGDY ENASEHLGAV QLLSADNERC ESALWGKFAA DILLRNWGGA 
LDDMNRLRDA LESNASTSNL VKMKQRAWLL HYALFVFFNH PNGRNLIIDV LFQERYMQAV 
QQEAPHLLRY LAVAIVANKK RRNMLKDLVK IIQSDVYDDP ALDFVVAAFV DYDFSKTQEM 
LKKCDAMIEK DFFLIGCKDA FDENARQYVI ENYCKVNKRI DIANLAQMLG MPAADVEATI 
ATLIRGSKLN ARIDSEAGFV HVHVEKKSVN EQIIEKTKAL LSKTTALTQA VLANTQAQAY