Gene OSTLU_33113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_33113
Symbol
ID	5003258
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	-
Start bp	411724
End bp	413074
Gene Length	1351 bp
Protein Length	241 aa
Translation table
GC content	58%
IMG OID	640418679
Product	predicted protein
Protein accession	XP_001419373
Protein GI	145349917
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.279741
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTCGGCACAC GCAAAGCCGT CCGCGGACGA CTTCGAACGA TCTTTCGCGC GTCATGCCGG 
ACGTGATGTG CGGAACGTGC GCGGAAGCCC CTGCGGCGGT CGTGCGCGTG GAATCCCAAA 
CCGGCGTCGC GCTGTGCGCG TGCGCGCGGT GCGATACGAG GTGCGCACGC GCGCGATGCG 
TCGCGGATTC GAACGCCGCG GTCGCGAGGC ACCCATGGGT TGGGTGAGGG TTGGCGCGCG 
CGTCGCGGCG CGCGCGCGCG CGGGCGTGGA CGCGCGCGCG GGGCGATCGA TGCGCGTAAA 
TTCTCTCCAC CGTCCGCGCG CGAATCCGAC GCGAACGGCG ATGCGCGGCG ATGGAAAAGC 
GCGGATAATC AGCGCGGCGC GTGGCGCTGG ATTACCGCCG CACAACGAGC CTTGGACTGA 
CCGCGGTGAT TATTTCGAGC GAACAGGCAA ACGGCGAAGC GCGGCAGTGG ACGATCGACG 
ACGCAACGCG TCGGATTGAG ACAAGCGAGT GGGAATGGCT CGGACGAACT TTCGTGCGAT 
GTGTGCCAAA TGAATCCGGC GTACGTGATT TGTCACGAGG ACCGGGCGTT TTTGTGCCGC 
GTGTGCGACG TGAGCATTCA CGAGGCGAAC GCGACGTCCA GGAAGCATCA GAGATTTTTG 
TTCGCGAACA CCAGAGTCGA GCTCGAGGCG ATGGGCGCGG GTGAAGAAGC TGGGACAAGA 
ATGTCTCCGA GTGATAGCGC CGCCGAGCAC ACGGTGCCGC AGTTTGAGCA AGAGGAGGTT 
GGGAGAAAGG TGCGTCGTTT ATCTTCACTT GTCCATATGA GGCGGCGAAT GAGAACTCAG 
AGACTGACTA TTTTTTACGG TTTTTTACCA TCACAGAGAA AGTACAACAG ACAACAGAAG 
GCATCTGTGC CTTCTGAAGA CGCAACCGTG CCGTCAATCG ATGATTTGGC GCCGGGAGTG 
TTCGAGAACT TCATGACAGG CTTGCTCGGC GAGGAGGAGG GTCGCAAGCA CATGGAGAAA 
TCCACGGCGG ATGAGAACAA TTTCTGGGGA GACATATTCT CGGAGAATTG GGCTGCCATG 
GACGGCATGA TGGACGATGA GCTGGCCGTT CCGAATTTCG ATCAACAAGT TCCGACGAAC 
GCCATGTACT AAAATTTTTT CTCTGATTCT TCCCTCGGAG TTTCGCATGC CTGAGACATC 
GAACGTGTAC AATGATTGCT GCTTGGAAAT CGAACGTCTC ATTCACAAGA CCTACCGTAG 
ATCAATAACA TAGAACGAGT TAGGGTGCAT TTTTCAGCGG ACCGCACCAC GCAACTCTCA 
ATAACAACCT AAAATCCCAT GAAAATTACA A

Protein sequence

MPDVMCGTCA EAPAAVVRVE SQTGVALCAC ARCDTRQTAK RGSGRSTTQR VGLRQASGNG 
SDELSCDVCQ MNPAYVICHE DRAFLCRVCD VSIHEANATS RKHQRFLFAN TRVELEAMGA 
GEEAGTRMSP SDSAAEHTVP QFEQEEVGRK RKYNRQQKAS VPSEDATVPS IDDLAPGVFE 
NFMTGLLGEE EGRKHMEKST ADENNFWGDI FSENWAAMDG MMDDELAVPN FDQQVPTNAM 
Y