Gene OSTLU_18783 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_18783
Symbol
ID	5006347
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009372
Strand	-
Start bp	9491
End bp	10681
Gene Length	1191 bp
Protein Length	396 aa
Translation table
GC content	51%
IMG OID	640421768
Product	predicted protein
Protein accession	XP_001422315
Protein GI	145356181
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCT CCGCACGTCG GCTCGGTTTG CGCGTGCTGT TGGCTTTTTG GTTGTTGAAG 
TTTGTATTGT CTTTGCAGTT CATAACACGC GGATGCGAGC GCTCGGTGAA GTATTTGAGC 
GAGATGTGGA TGCGAGAAGA TGCTTGGACG CACTGTCGGA ACTGCTGCGG CGACGTGAGG 
GAACGAATGC TGAAGTTCAG TTCATTTGGC TTGGGTAAAG ACGTCGCGTG TTTCACCATT 
CATCCGGAGG CGACTTCGCC GTCGTCGTAC ACCTTCGTCG CACGCAGGCG TGAACCGCTG 
AATCGTAGCT ACTTTAAAAG TGCCCTGCGG TTTCTCCGAG ACGTCGCTGT GGAACGGCGA 
CAGAACCAAG GAGAACGAAG CGACGTGGCT CTACGACTCC TTTGGGTGAT TGACGACGAT 
GCCTCTATGC CGAGGGAGCT GAAACGGGAA TTGAAATCCT TGAACACTTT CATTCTGGCG 
CATTCTATCA ATGTGGATTG TTTCACCGAC GAATCAGTCG TGCTCGCGCC AAACTTCCAC 
TTCATCAAGC GCGACGGGTT CAAACCGTTG CTTCGGAATC TGCGTGAACG TGAGATTCCG 
TTTGATGAAC GCAAATCCGA CGTATTCTGG AGAGGCTCGA CGTCTGGTAT GTCAACAAAA 
TGCGAAATAG AAGAACCCGC TCGCGTCGAC GTGAACGAAA GGGTTACCGC GTGCGTTGAA 
CTTCCGCGCG TGCGAGCGGT GCAATCATCC ATAAATGTTC CTTGGCTCGA CGTCGAGATC 
ACGCGAAGGG TACAATCGTG TAAAGGACAA ACAAATGTAC GCATTAGCCC GCACGTATCG 
GAACAGCATT GGATCACGCA CAAAGGTATC CTCGAAATCG ATGGAAACGT CGACGCGTGG 
GGAAACCGTT GGCGCATGGA AAGCGGGAGC GTCCTGTTCC TCGTCAAGTC AAATTTCAAG 
CACTATTACA GCGACAAGCT GGTAGATGGA GTACACTACA TCGGAATATC TGGAGATTTG 
CACGATTTAG TGGAAAAAAC GAAGATTGTG GCGAACACCG ATGGCGAATC GCTAACGAAG 
TTGCGTGATA TCACAGCAAA TGCTCGCGCG TTGATGCAAG AATTTACGTA CGAGCGCGTC 
GTCAAGGGCG TTTCCCATCG TCTGAATGAG CTAGCCTTAG GTATGGTATA G

Protein sequence

MKTSARRLGL RVLLAFWLLK FVLSLQFITR GCERSVKYLS EMWMREDAWT HCRNCCGDVR 
ERMLKFSSFG LGKDVACFTI HPEATSPSSY TFVARRREPL NRSYFKSALR FLRDVAVERR 
QNQGERSDVA LRLLWVIDDD ASMPRELKRE LKSLNTFILA HSINVDCFTD ESVVLAPNFH 
FIKRDGFKPL LRNLREREIP FDERKSDVFW RGSTSGMSTK CEIEEPARVD VNERVTACVE 
LPRVRAVQSS INVPWLDVEI TRRVQSCKGQ TNVRISPHVS EQHWITHKGI LEIDGNVDAW 
GNRWRMESGS VLFLVKSNFK HYYSDKLVDG VHYIGISGDL HDLVEKTKIV ANTDGESLTK 
LRDITANARA LMQEFTYERV VKGVSHRLNE LALGMV