Gene OSTLU_29635 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_29635
Symbol
ID	5006842
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009375
Strand	-
Start bp	11597
End bp	12730
Gene Length	1134 bp
Protein Length	377 aa
Translation table
GC content	58%
IMG OID	640422263
Product	predicted protein
Protein accession	XP_001422877
Protein GI	145357339
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	64
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACGACA TGTATCACAG ACATCGAAGG CTTAATGACG ATGTGGTGAT GTCGTTCGAT 
GCAGACTCGA TTCTGCAATC CAGTGCGACG GACACGAACG CGATGAGCGA CTTCGACCGC 
GCGGCGCAAT GCGCTTCGAC GGAGGATGCG CTTCGGACGC TTGGCATGTT AGCTATGCCA 
AGCGAGTTTC GTCAATCGCG GCTCGAACGA CAGCGCGAGG CCGCGAAGAG GAAAGAAAGC 
GTCGCACGTG TGTCGAGTGG GCCCAAAACG TCTTCCGCGG TTGTCGACAT TGATCCGTTT 
GCTGAATACT TGCAGCACGA TCGTGGGTTT GCGCCGGCGC GCGTTTCGTC AAAGCCCGCC 
GGCGTAAGTA GTCCACCGCC GTCGATGAGG ACGGCGAAGC CCGCGCGAAG ACCAACTGGA 
GGTTCTTACA CGAATGCTCG GAAGCACGGT GCTTCGACGT CGGTGTCGAG GCTCGCACGT 
GTTCCATCGT CCGAGTCCGA TGACGACATT GTGCCGGCGC GCAGGCGCCG AGACTTCGAC 
GTTGGTTTCA GGCGCACGGC GAGCGGAAAG TTTACATTTG GCGGAGAGGA TCGAACGCAG 
ACGCGCGTCG CATTTGAGCC GCAAGTCCAC GTAGCGCAAA GTCGGAATCA CGAGGACGAC 
TTTCGCGCTG ACATCGAGCG TTGGCCACAA CTACAGCCGG AGACAAACGA CAACGCAGAA 
GATGAGCAAA TCGCCGAGGC GATACGCTTA TCGAAGCTCG AGTTTAAAAA GCAATCGCGC 
GAGCACAACT CGGCGCGGGC CATGCACATC GAGTGCGATG AGCTCTTCGG CGACATGACG 
GAGGAAGAAA TCGTCGCCCT CGTCGTTCGC ATGTCGCAGG AAGAGACGAC GAGCGAGGCT 
GCTTTGCCAA TGCCGACAAA GACGGAGTGG GTGAACGCGC GTCTCGGCGA AATATTTTTC 
CCCGACATCG AGCGCGCGAG ACAGGTTGCG GAAATATTCA GAGCGACTGA AACCGACCGA 
AATGCGACTA TCGATTTGCT CATTGGTGCC GGCGCAGCGG AGAGCGACGC TAAAGCGTTT 
TGGGAATTGT TTGACGCCGT CACGCTGACG GATAACGATA GCCACGTAGA TTAG

Protein sequence

MYDMYHRHRR LNDDVVMSFD ADSILQSSAT DTNAMSDFDR AAQCASTEDA LRTLGMLAMP 
SEFRQSRLER QREAAKRKES VARVSSGPKT SSAVVDIDPF AEYLQHDRGF APARVSSKPA 
GVSSPPPSMR TAKPARRPTG GSYTNARKHG ASTSVSRLAR VPSSESDDDI VPARRRRDFD 
VGFRRTASGK FTFGGEDRTQ TRVAFEPQVH VAQSRNHEDD FRADIERWPQ LQPETNDNAE 
DEQIAEAIRL SKLEFKKQSR EHNSARAMHI ECDELFGDMT EEEIVALVVR MSQEETTSEA 
ALPMPTKTEW VNARLGEIFF PDIERARQVA EIFRATETDR NATIDLLIGA GAAESDAKAF 
WELFDAVTLT DNDSHVD