Gene OSTLU_18885 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_18885
Symbol
ID	5006492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009373
Strand	+
Start bp	99578
End bp	100696
Gene Length	1119 bp
Protein Length	372 aa
Translation table
GC content	70%
IMG OID	640421913
Product	predicted protein
Protein accession	XP_001422391
Protein GI	145356341
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	0.0152699
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0000000221114
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCGGCGA AGTGGATCGC GTACGACGAG ATCGAGTGCG TGACGCCGAG GTGGCCGGGG 
ATCGGGGCGA CGAGCGGGAC GCCGTCGACG ACGTGTCACG TTCGAGCGTC GAACGACGGC 
GGCGAGCGAT TCGACGATCT CGTCGCGGCG GGGGGGGACG GCGATGGGAC GTTCGCGACG 
CCGATGGCGA ACGCGGCGAA GATTGACTTC ACGTACGACG CGAGCGGCGC CGCGCCGAGC 
GTGAGCTCGG TGGAGACGTC GCGCGCGCCC GCGGCGAGCG CGCGGGGCGC GCGGGGACCG 
TTCGACGGCG GGACCGTGGT CACCGTGCGA GGGAGCGGGT TTTTATCGAG CTCGAACTTG 
GCGTGCAAAT TTTTCGATCC GCTCGGGAAC GAGGTCGTGG TGCGCGCCTC GTACGAGAGC 
TCGAGCGAGG TTCGATGCGC GTCGCCGTCG CAAATCGCGA GCGTCGACCC GTACGCGGTG 
GATTACGTCG CGATGACGTC ACCGTGCTAC GCCTCCGCCG TGCACGTGTC GAACACCGGT 
CTCGTCGGCT CGTGGAGCGC CGCGAACTCG GCGCCGACGG CGCAGTTCTT CTATTGCGAC 
TTGTACGTCG ACTCGAGCGC GGCGTCGGCG TCGAGCGCCG ACGGGAGCGC TCTGAAACCG 
TTCGACACGA TTCAACGCGC GCTGCAGTCA GCCTTGACCG GCGTCCAGAG CGCGAGCGAC 
ACGCACATCG GGCGCGAGTT CGCCCTCGCG AATCCCACGG CGAACGCGCT GTTGAACGCC 
GACGTCGTCC GGCTCGCCCC CGGCGCGTAC GCCGGCGCCG GCGCCGTCAG GCTCGTCGCC 
GACCCCACGT CCTCGGTCCG CGTGCGCGCC GCGACGGGCG TCGCGTCCGC CGCCGCCGAC 
CGCGCGTACA TCGATTGCGA GGGCTCGAAC CCACTCTTCG CCGATCTCGA CGCGCAGTCG 
TCGTCGTCGC GCGTCGCCGT CGTCGTCGAC CCCGACGTCG CCGTCGTTCG ATGTCGCGAC 
GCCGACGCGA GCGTCTACGG CGTCGAGAGT TGCGAGACCA TCGTCGCGAC CGATGGGTCG 
GGCGTCACCG CGCGGACGTG TAATTTCGCC GCCGCCTAG

Protein sequence

MPAKWIAYDE IECVTPRWPG IGATSGTPST TCHVRASNDG GERFDDLVAA GGDGDGTFAT 
PMANAAKIDF TYDASGAAPS VSSVETSRAP AASARGARGP FDGGTVVTVR GSGFLSSSNL 
ACKFFDPLGN EVVVRASYES SSEVRCASPS QIASVDPYAV DYVAMTSPCY ASAVHVSNTG 
LVGSWSAANS APTAQFFYCD LYVDSSAASA SSADGSALKP FDTIQRALQS ALTGVQSASD 
THIGREFALA NPTANALLNA DVVRLAPGAY AGAGAVRLVA DPTSSVRVRA ATGVASAAAD 
RAYIDCEGSN PLFADLDAQS SSSRVAVVVD PDVAVVRCRD ADASVYGVES CETIVATDGS 
GVTARTCNFA AA