Gene OSTLU_38469 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_38469
Symbol
ID	5001841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009359
Strand	+
Start bp	356287
End bp	357438
Gene Length	1152 bp
Protein Length	383 aa
Translation table
GC content	62%
IMG OID	640417262
Product	predicted protein
Protein accession	XP_001417745
Protein GI	145346541
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.416523
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGACG CCGACGCCGC GGACGGCGTC GAGGGCGACG CGCGCGAGCG CGAGGCGTTT 
CTGAAGATCG CGCGCGCCGT GCACGCGTAC GACGCCGACG CGGCGCGACT GCTCGAGCGA 
TGGCGCGCGC GACTCGAGCG GGACGACCTG CCGAAACGCT ACGACGGCGC GCTCGACGGC 
GCGCGACGGG ACGTGCGAAC GCTCGGTGCG AAAGCCAAGG CGTTAAACTA TGATTTCTTG 
CGGTGCGCGC TGCACACGTT CGTGGATAAT GAGCGCGCGC CCGCGCATTT GCGCATTCCG 
AGCGCGCGCG TCGCCGCGTG GTCGCGGGAC GAAGCGTTTC GCGCGGAGCG GGACGACGTG 
GATAAGGTGC GGTACGTGCT GAAGAATGTG TGGCGAGATT GGTCGGAAGA GGGTGCGCGC 
GAGCGGAAAC CGGTGTACGA TTTGATATTC TCGGCGTTGA GGGAGAAGTT GGGGGCGATC 
GACGCGCGCG TCGGGAGCCC GGTTGGCGAG GCGCCGCGCG TGCTCGTGCC TGGATGCGGT 
TTGGGACGAT TGGTGTTTGA GTTAGCCAAG CTCGGATACG ACGCGCAAGG GAATGAGTTT 
AGTTACTACA TGTTGATGTT CTCTTCGTTT TTGCTGAACG CGACGAGCGA GGTTGGGGAA 
TTTGGAATTT GTCCATGGAT GCATAGTCGA AGCAACCATC GCGAGGCGGC GGACATGTGG 
CGGGAAACGC GCATCCCAGA TGAGGTTCCG GGCGACGCGA ATTTGCCACC AGGAGCGATG 
ATGAGCATGG CCGCTGGGGA CTTCGCGGCG GTGTACGGAG AGGCGCGCGA AACCGGAATG 
TGGGACGCCG TCGTGACGTG CTTCTTCATC GACACCGCGC ACAACATCGT AGAGTATTTA 
GAGTGCATCG CCAACTGCCT ACGTCCTGGA GGATGTTGGG TGAATTTCGG GCCATTGCTT 
TATCATTGGG AAGAGTACGT CGACGAACAG AGCGTCGAAC TGTCGCTCGA GGAAGTGCTC 
GCCGCGGCGG AATCGTTCGG CTTGCGCGTC GAGCGCTCGG AATCGACCGC GCCAGTCGAC 
TACACGAGCG ATCCACGCTC CATGCACAAG ACGACGTACT CGTGCGCGTT CATCGTCGCC 
ACCAAAGTGT AA

Protein sequence

MVDADAADGV EGDAREREAF LKIARAVHAY DADAARLLER WRARLERDDL PKRYDGALDG 
ARRDVRTLGA KAKALNYDFL RCALHTFVDN ERAPAHLRIP SARVAAWSRD EAFRAERDDV 
DKVRYVLKNV WRDWSEEGAR ERKPVYDLIF SALREKLGAI DARVGSPVGE APRVLVPGCG 
LGRLVFELAK LGYDAQGNEF SYYMLMFSSF LLNATSEVGE FGICPWMHSR SNHREAADMW 
RETRIPDEVP GDANLPPGAM MSMAAGDFAA VYGEARETGM WDAVVTCFFI DTAHNIVEYL 
ECIANCLRPG GCWVNFGPLL YHWEEYVDEQ SVELSLEEVL AAAESFGLRV ERSESTAPVD 
YTSDPRSMHK TTYSCAFIVA TKV