Gene OSTLU_38674 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_38674
Symbol
ID	5001799
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009359
Strand	-
Start bp	386973
End bp	388166
Gene Length	1194 bp
Protein Length	397 aa
Translation table
GC content	53%
IMG OID	640417220
Product	predicted protein
Protein accession	XP_001418004
Protein GI	145347077
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.201986
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.16101
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGATCG TAGAAGCGAT GCAGAAGTTT TGGAAGCGGC TTCGAGTGAT GGACCGAAAC 
GATATTTTGC GTTACAAACA TGTGTGGTAC GTGCCGACTC TAGAACATCT CTCAGACGAC 
ACGCAAACGC TATCGCACGG TTCCGGTGCT AGCAGTGGTG ACGAGGACGA TGCCTTTCGC 
ATCAGGAAGG GCGAGCACGT GGCGTTTCGA TTTGAAATGT TCAATTCACT CGGCGCGGGA 
AATTTCGGTC AAGTTGTGCG TTGCTTTGAC CATAAATATA AGCGCGAAGT GGCACTTAAA 
CTGATTTCTC CTGACGAAAC ATTTGCGAGT CAAGCTCGCG TGGAAGTTTC GGTGCTCAAA 
CGTGTCGAAG GTGGTTCGAG TCGCGTAGTG AAGATGTTCG AGCATTTAAA GTTTCGCGGT 
CGATTGTGCG TTGTGTTTGA GCTGCTTCAC ATCAACTTGT ACGAGTTCTT GGAAGCCCGC 
GCGTTCGCGA AGTTAGATAT TCAACACGTC CGCCATATCG CTCGGCAAAT GGTGGATGCG 
CTCGTGTACC TCAAACACAT GCAAGTGGTG CACTGTGACA TCAAACCCGA AAACATTTTG 
CTAGAACATC CTGGCTCGTT CGATGTCAAA CTCATCGACT TCGGAAGCGC GTGTTTTCAG 
GGAAAACAAG TGTATACGTA CATTCAGAGC CGATTCTACC GCGCTCCGGA AGTCATGCTC 
GGAATCGATT ACGGCCATCC CATTGACGTA TGGAGCTTGG CGTGCGTTCT CGCCGAGCTT 
GCCACTGGCA AAACTTTATT TGTGGGCGAC GATGAGGCAC GCCAGTTAAG CGCGATCACC 
TCGCGGATTG GGCCTCCTCC ACGCCGCATT CTTAGCTCGG CAGCACACTC CGATCGCCGA 
GTCGACTTTC ATGTGTGCGA GTCGTCGTTT GCGAGAAGTC GACGAGACGA CAAACGTAGC 
GATCGGACAT CCTCAAAGCA CAAGCCGCGA AGCAAGCGCA CGAAAGTCAT CGATATCGAC 
GACGATCGGT TCAACGCATT TCTACTACGA GCGCTGCACT GGAATCCGTC TCGACGGTTG 
ACGCCCGACG CCGCTCGGCG GCATAGTTTC CTGCAAAAAC GTCAAGCCGT CGTTGGTGAG 
GCCGCAGTCG ACGACGCGGT GCGCACCGGG CGCGAGCTTC AAACCACGAG ATGA

Protein sequence

MSIVEAMQKF WKRLRVMDRN DILRYKHVWY VPTLEHLSDD TQTLSHGSGA SSGDEDDAFR 
IRKGEHVAFR FEMFNSLGAG NFGQVVRCFD HKYKREVALK LISPDETFAS QARVEVSVLK 
RVEGGSSRVV KMFEHLKFRG RLCVVFELLH INLYEFLEAR AFAKLDIQHV RHIARQMVDA 
LVYLKHMQVV HCDIKPENIL LEHPGSFDVK LIDFGSACFQ GKQVYTYIQS RFYRAPEVML 
GIDYGHPIDV WSLACVLAEL ATGKTLFVGD DEARQLSAIT SRIGPPPRRI LSSAAHSDRR 
VDFHVCESSF ARSRRDDKRS DRTSSKHKPR SKRTKVIDID DDRFNAFLLR ALHWNPSRRL 
TPDAARRHSF LQKRQAVVGE AAVDDAVRTG RELQTTR