Gene OSTLU_17964 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_17964
Symbol	SDG3520
ID	5005552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	-
Start bp	19820
End bp	20970
Gene Length	1151 bp
Protein Length	384 aa
Translation table
GC content	64%
IMG OID	640420973
Product	predicted protein
Protein accession	XP_001421367
Protein GI	145354174
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCGT GCGACGTCGC CGTCGCGCGC GCGCGCGAAC GTCGAGGCGG AGGTCGAGGC 
GTCTTCGCGA CGCGCGCGTT CGAGCGAGGC GAGTGCGTGA TGATCGAGCG CGCGCTCGTG 
GGAGCGCAGC ACGAGGAAAA CGTGAAACAC GCGCGCGCGT GCGAAAATTG CCATCGATAC 
GTCGGGACGG TGTCGAGCGC GGTCGGACGA AGGCTGCTGG AAAAGTACGC GAACGCGGCG 
CCGCCGAAAC CGACGACGCG CGAGGATTTG GTGAAGCTGG CGAGCGGTGA GGCGACGCTT 
CCGGGCGCGG ATGCGTTCGA TGGACCGCGT GAAGTTGGAT GTTTGGGCGC GTGCGCGCGA 
AACGTGTACT GCTCCGAGGC GTGCGCGTCC GAGGCGTGGC GCGAGAGAGA GTCGCTCATG 
TGTCCGGGAG AGAAGGGGAC GGCGACGAAT AAGCGGGCGT TGGATGAATT TTACGCGCAC 
GCGAGGGAGA CGAACGATAT ATTTATTTTA GCGGCCAAGG CGGTGGCGAC GATGTGCGCG 
CGAGCGTCGC GGGCGAGCGC GAGAGATCGA GACGACGGGT CGAGCGGAAA GGAGATCGAG 
CGGGACGCTT CGGCGGCGGA AGACTTTGCG CGCCTGCCGT TCGCCGTCGT CGCCAACGCG 
CCTTGGTGGG AAAGCGTGGC GACGCCGCAC GACTGCGAAG ACGAGCGCGC GGAAATGGAA 
TTCCGCACGA CGTTGCGAAC GCTCGCGCAA GACTCTTTGG ACTTGCTTCG ATCGGCTTGG 
GGCGAAACGG CGAACGCTTG GCCGCGATTC TTCACGCTCG AGACGTACGG CAGACTCATC 
GGAGCGTTTG AACTGAACAA CCTCGAGCTC GTCGTGGAGA GCCCGGTTGA GAATTACTTT 
CTCGCGATCG ACGCGGCGCC AGATGGTGAA GAGAAGCGAG CGGCGATGCG CGTCACGCAG 
CCACTGCTCG ACGCCTTGGA TACGGAGTAC GACATTCCGC TCCTCGGCAG CGCGTTGTTC 
TCCGTACAAT CCGGATTCAA TCACGACTGC GACCCGAACT GTGAGCCGAT GAAGGGAGAG 
GAAGACATCG ACGGCGCGTG CGTCATCATC GCGCGGCGCG ATATCGCAGC CGGGGAAGAG 
TTGACGATCT C

Protein sequence

MTACDVAVAR ARERRGGGRG VFATRAFERG ECVMIERALV GAQHEENVKH ARACENCHRY 
VGTVSSAVGR RLLEKYANAA PPKPTTREDL VKLASGEATL PGADAFDGPR EVGCLGACAR 
NVYCSEACAS EAWRERESLM CPGEKGTATN KRALDEFYAH ARETNDIFIL AAKAVATMCA 
RASRASARDR DDGSSGKEIE RDASAAEDFA RLPFAVVANA PWWESVATPH DCEDERAEME 
FRTTLRTLAQ DSLDLLRSAW GETANAWPRF FTLETYGRLI GAFELNNLEL VVESPVENYF 
LAIDAAPDGE EKRAAMRVTQ PLLDALDTEY DIPLLGSALF SVQSGFNHDC DPNCEPMKGE 
EDIDGACVII ARRDIAAGEE LTIS