Gene OSTLU_18023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_18023
Symbol
ID	5005339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	+
Start bp	162826
End bp	163935
Gene Length	1110 bp
Protein Length	369 aa
Translation table
GC content	60%
IMG OID	640420760
Product	predicted protein
Protein accession	XP_001421222
Protein GI	145353870
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.150148
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTACG AGACGCTGCG GCGGCGCGCG GCGGAGGCGG CGTTCGACGA GACGTCGACG 
ACGCCCGAGT ATCGTGGGTT TTTGAATCAC GCGAGACGGT GCGTCGATGG GAGCGGAAAG 
ATCGACTGGG GTTCGGTGAC GCGCGTGGGG GGGCTGGCTG GGTCGAGAGA GGTGCGGCGG 
GCGCGCGGGG TGGACCCTCG GGACGTCGAG GCGGCGTGTT TGCGAGGCGA AGGCGAACCT 
TTGATCGTCG AGGACGGAGG GAAAGATTGG GCCAAGTGGG ATTTTGAAAC GCTTCAAAAC 
GAAATCGGTG ATTTTGAGGT GTTGTGTAAC GATCGAGCGC CCGCGCGGCG ACGAGAGATC 
GATGGATCCA AGCAGCGGTC GCACCTGATT CCGTTTCGGG CGTACGCCGA CTACGTACGA 
AAGCGCGACG GCGTCGCCGG CACAGTCTTT GACGATCGCC GCACGCCGTT TTATGCAAAC 
GGCATGCGCG TATTCAGCGA GTGCAAGCGC GCCGACGCCC TCTCGCGGGC GTTTCCACGA 
CCTTATTTCA CGCACGAGTG CGATAATACG GAGACGCTGC TCATGGCGAC AACGAACGAG 
CTCGGGTCGA TACTCAAATT TGACTCGGAA ATCGCGCTCA GAATGCGTGA CAGCGTCTCA 
AAATCGCTCG ACAAGATGTT TGTCGGGCCT CGAGGCGCAC TCACGCGCCT TCATTACGAC 
GCCGGGGACG CTCACGGTTG GCTGGGACAG GTCGAGGGGC GGAAGCTCTT CGTGTTTTAT 
CCGCCCAGCG CGTCGCCGAT GCTTTATCCG ATTGAAGACT CGCACGCCAG CGTCGATCCA 
CTGGAGCCAG ACTACGATCG ATTTCCACTA TTTCGCGAAG CGCAATCGCG CGCGCGAGTG 
TGCGTGCTGA ATCCGGGAGA AGTCGTACTG TGTCCTCGAC GATGGTGGCA CTACGCCGTG 
GCCCTGGACA CTAGCGTCAC GGTTATGAGG AATTGGTACA ACGTCAATAC CAACGCCCAG 
GCGTTGGTCG AGCAGATATG CTCCACGATT AAACAAACAG TAGACAATAG AGCGAAAGGA 
TCCGTGCCTC GAAACGAAGC GTCTCGATGA

Protein sequence

MDYETLRRRA AEAAFDETST TPEYRGFLNH ARRCVDGSGK IDWGSVTRVG GLAGSREVRR 
ARGVDPRDVE AACLRGEGEP LIVEDGGKDW AKWDFETLQN EIGDFEVLCN DRAPARRREI 
DGSKQRSHLI PFRAYADYVR KRDGVAGTVF DDRRTPFYAN GMRVFSECKR ADALSRAFPR 
PYFTHECDNT ETLLMATTNE LGSILKFDSE IALRMRDSVS KSLDKMFVGP RGALTRLHYD 
AGDAHGWLGQ VEGRKLFVFY PPSASPMLYP IEDSHASVDP LEPDYDRFPL FREAQSRARV 
CVLNPGEVVL CPRRWWHYAV ALDTSVTVMR NWYNVNTNAQ ALVEQICSTI KQTVDNRAKG 
SVPRNEASR