Gene OSTLU_50546 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_50546
Symbol
ID	5003913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	+
Start bp	99682
End bp	100817
Gene Length	1136 bp
Protein Length	334 aa
Translation table
GC content	57%
IMG OID	640419334
Product	predicted protein
Protein accession	XP_001419490
Protein GI	145350171
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.00915074
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0604025
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ACGTCGACGA TGGGTTTGAT GAAGAGATCA GCAATCAGAA TGGCGATAAA ACCGGTCTTG 
ATCGCGTGGG CGTGAAGATT ACGGCGTCTT CGTTGTACAT TCTTCAGGGC ATCGTCGAGT 
ACACGGCGCT GATGCAAGTA ATGCGGCCGA GCGTGCCGGT GATTTTCAAC GGTATCTGTC 
AACTCTTCGA GCTCGCACTA GTGAAAACTT TTAACGCTTT CGGGCGAACG GAAGCTTTGC 
TTCCCGAATC GCACGACATG ACGCCGCGGC TGCGAGGTAC GTTGTCTAGA CTCGGGAACT 
CGGGTGGCGC CATGGCGATT CGACCTACGA TTCGGGGACA AGGGGACGTA GACATCTTGT 
CCAGCGGTAA TTTGTACGGT TTGAAGGAGC GCGGCATCGC GCTCGAGTCG CTCTCGCGCG 
TCGCCGATGA GTTCAAGCGC ATCAAGGCGC GTGTGAAACG CTCGCTCCCG CTCAAAGACG 
CCGCGCTGGC GGATCGCTTT TACTCGCACA CCGTCGCTGC GGTGGACGAT TTGCGCGAGC 
ACGTGTACAA GAACGTTGCT TCATTATTGC TCAACATTGA ATTTTGCGCA GAAGCGATCG 
GAGACGGCGA TCCAAACTTT GCGTTGGTGA ACTCTACGTT CGTGGGCAAG TACAACATTC 
GCGAGACGCC GTCGAGGCAC AACAAGTGGG TGGACGACGT CCAGGCCGAA CTCTTACAGT 
TCACCACCAA ACTCGCCTGC GCCGACGTCG CACCTGAAGC TCTGGATGTT CTGTGGCAGC 
ACGCCGCGAG TGTGATCCAA GACTCTCTCG TCGATGGTTT CAGCAAGGTG AAAAAATGCA 
CCGACGCCGG CAGAGCGCTC ATGGCGCTCG ACGTCGAAAC CCTGCGCGGC GAATTCGCGA 
AACTCGCCCC GTCCCAGTCC CTTGCCTTCG ACTGGCGCTA CGTCAGCACC TACATCAACG 
CCTTCTACGT CCCAGAAAAA GACGTCGAGA AATGGATGCA AATCCATCCC GAGTTTTCCA 
AAAAACAAAA GCTCGCCTTG GTCGCCCACA ACGCCTCGGC GGATCGCGAC AGGCGCTGGA 
CCGCGAAATT CCGCCAAGAC TTGCTCAACG CCATCGAAAC CGACACGTTA CTCTAG

Protein sequence

MQVMRPSVPV IFNGICQLFE LALVKTFNAF GRTEALLPES HDMTPRLRGT LSRLGNSGGA 
MAIRPTIRGQ GDVDILSSGN LYGLKERGIA LESLSRVADE FKRIKARVKR SLPLKDAALA 
DRFYSHTVAA VDDLREHVYK NVASLLLNIE FCAEAIGDGD PNFALVNSTF VGKYNIRETP 
SRHNKWVDDV QAELLQFTTK LACADVAPEA LDVLWQHAAS VIQDSLVDGF SKVKKCTDAG 
RALMALDVET LRGEFAKLAP SQSLAFDWRY VSTYINAFYV PEKDVEKWMQ IHPEFSKKQK 
LALVAHNASA DRDRRWTAKF RQDLLNAIET DTLL