Gene OSTLU_89208 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_89208
Symbol
ID	5005243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	-
Start bp	658237
End bp	659592
Gene Length	1356 bp
Protein Length	451 aa
Translation table
GC content	62%
IMG OID	640420664
Product	predicted protein
Protein accession	XP_001421525
Protein GI	145354508
COG category	[B] Chromatin structure and dynamics [K] Transcription [L] Replication, recombination and repair
COG ID	[COG5406] Nucleosome binding factor SPN, SPT16 subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.466443
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.336204
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGGGGG AGGAGTACGC GGGACGAAGC GCGTCGAGGC GGGACTTCGC GCGGGACGAA 
CCGGAGGCGG CGCGCGAGAC GGATGAGGAC GAGAGCGACG ACGACGACGG GGACGACGGG 
GACGACGACG AGGAAAGTGC GGAGGAGGAT GGGGACGCGA GCGATGAGGA TCCGTACGCG 
GATGAGGACG ACGACGCGTA CGAAGGGTAC GACGAAGACG CCGCGGCGAC GGGATCCGGA 
CGAAGGAACG GCGGCGACGA GGACGACGAG GACGAGGACG ACGAGGATCA GAGCGATGAG 
TTCGACGCGC AGGGCGCGCG GGCGAGAGAT TTGTTGGGCG CCGCCACGGA AGGCGACGCA 
GATCTCGCTC GAGAGCTTCA AGCGTTTCGC GAGGAGGAGG AACAAACGAA GAAGCTCGTC 
GACACCAAGG CGCAGCACGT CTCGAAAGGT AAGGCGGTTC GCGCGCAACG AACGGTTTGG 
GAGCGTGCGC TACACGCGAG AATTCGTTTG CAGAAAGTCA TGACCGGAGC CGCCAAGTTA 
CCGACGGCGT TGGCGTGCCG AGGACTGAAA CGCGCGTCGC CCGAGACGCG CGAATCGTTC 
GAGACGTTAT CCAAAGTCGC ACGGAAGACC ATGCGAACGC TCTCTGCGCT TCAAACTGCG 
TTGATGGCGA ACATAGCCGA CATAGCCTCG ACCTCAAATC TCGGCGCGGA CGCTACGGTG 
ATTGGTGTGG ACGACGACTT GGACGACGCG TGGACGAAGC ACGACGCCGG ATACAGAGCG 
TTCGCAAACT ACCGCGACTC GACGTGCGAT CGATGGTACA GAAAATCCGC CGTCTCCGTG 
GGTAAAGCGG TCGGCGGAGG CGCGGGCGGC GGTCTGAAGG CGTTCAACCA GTCCATCTCT 
CAGCAAGTAT CGTCCACCAT GCGCGCGCCC GCGCGTTTGA TTGAAAAGTC GCAGCCGCCG 
AAGCGCAGCG CGCCGATTCG CGTCGGTGAG CGACGCGCCG CCGTGCGGAG CGAAGAAGCC 
GACGATGACG ACGAGAACAA AGCCGAAACC GTCAACGTCG ATGGCTTGGA CGAAGGTGAG 
GCTCGCGAGT CGGAGCTTTA CGACGACGTC GACTTTTACG AGCAACTCCT CAAAGAGTTC 
CTCGAGAGCG GCAACGACGC CGGCGTCGCC GGTGGACCTT CCGTCGTCTC CAAACAAATC 
AAACGTCGCA AAAACGTCGA TCGCAAGGCG AGCAAGGGTC GAAAGATTCG TTATCACGTC 
CAGGAACCGC TCGTGAACTT TACGCAGGCA AACGACGTGG AAATTCCGGC GTGGGCAGAG 
CGCGTGTTTT CGCAACTCTT CGCCTCCAGC GCGTGA

Protein sequence

MEGEEYAGRS ASRRDFARDE PEAARETDED ESDDDDGDDG DDDEESAEED GDASDEDPYA 
DEDDDAYEGY DEDAAATGSG RRNGGDEDDE DEDDEDQSDE FDAQGARARD LLGAATEGDA 
DLARELQAFR EEEEQTKKLV DTKAQHVSKG KAVRAQRTVW ERALHARIRL QKVMTGAAKL 
PTALACRGLK RASPETRESF ETLSKVARKT MRTLSALQTA LMANIADIAS TSNLGADATV 
IGVDDDLDDA WTKHDAGYRA FANYRDSTCD RWYRKSAVSV GKAVGGGAGG GLKAFNQSIS 
QQVSSTMRAP ARLIEKSQPP KRSAPIRVGE RRAAVRSEEA DDDDENKAET VNVDGLDEGE 
ARESELYDDV DFYEQLLKEF LESGNDAGVA GGPSVVSKQI KRRKNVDRKA SKGRKIRYHV 
QEPLVNFTQA NDVEIPAWAE RVFSQLFASS A