Gene OSTLU_19107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_19107
Symbol
ID	5006812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009374
Strand	+
Start bp	448339
End bp	449547
Gene Length	1209 bp
Protein Length	402 aa
Translation table
GC content	57%
IMG OID	640422233
Product	predicted protein
Protein accession	XP_001422593
Protein GI	145356759
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.258179
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTTTT GCGATAAGGC ATTCTCGTGC GCGTGGCTCG CGGATGATCT GGCGTTGATC 
GGGACGAAGG ATAATCGGTT GTTTGAGTTG GAGATCGATC GACGAGGGCG TCGAGACGCG 
TGGCGCGAGA TCGAACTCGG AAGGGAGGAC GCGTACACGA GGAACCGGGC GATGGAGATC 
GCCGCGCAAT GGGTGAGCCG ACACACGCCG CAGGCGTTAC GAGCGATCAA CGTTTCTCCG 
CCGTTCTTGG CCGGTCCCTA TGGGCACGGC GCGGTTCGCG CCGCCGCTTC GAGACGGGGC 
GGCGCCCACG CGTGTTCGGT GAGCTCGACT CGAGAGCACA TCGTGTGTAG CGGTGGTCCA 
TCACACAACA TCGTTGGGTT CCGTCGAGAC GAGGAGACGG AATGTCTCGT GCCTAGAATG 
GCATTTTCTG GGCACGACGA CGTCGTGTTC GACGTTGGCT TCATCGGACG AGACGCGATG 
GCGTCGGCGT CGCGCGACTG CACGGTGAAA GTCTGGCAGC TTCCTAAGAG TCCTAGCTAC 
GACGAGATAA GAATCACTCC AAGTGGTTCG GTGCACCCGA TCGGAGAGTG CACGCAGAAC 
GAACGCGTGC GTGGCGTCAA GGTTGTTGAT CGATGTCCCG CTCGTCATCT TGCGACGTGC 
ACGTCGAGCG GACACGTACT TCAGCTCGAC GCAGAGACGC TTTCGCTCGT ACACAGTGGA 
TATCAGTGTC GAGGATATCT CGAAACTTGC TGCCTCGCCA CCGATGGCCA AATCGTCGCC 
GTCGGTTCTC GCACGCACAT TGGTTTCGTG GACTTTCGAT CAAAAAACTT TTACGCCTCC 
GTAGCGCTAC CATACGGCGA TACCAACAGC ACGCGCAGTC TTAGTTTCCA TGAGGGCGGC 
AATCTACTCA CAATTGGCGG CGGTCGAGGA TTGATTTCGT TTTACGACGT TCGCATGCGA 
AAATATCTCG TCGATAACGG TCGAGGTCGG GTGCGCCAGC TCTTCAACAA CCAATATTGC 
GTCCCCTTTG CAGACAACGG GATCTTCGAG GATGAGCACG ATGACGACTT TTACGACATT 
GAGATTCGCG ATTACTGTTT GCCAGCAATC TTTGCGCATC AGTGGGACCC GAGTGGAACA 
CGTTTGCTCT GCGCCGGTGG GCCGCTTCAG TCGATGCTAC ACGGCTTCTT TGTGGGCGTG 
TGGAGTTAG

Protein sequence

MSFCDKAFSC AWLADDLALI GTKDNRLFEL EIDRRGRRDA WREIELGRED AYTRNRAMEI 
AAQWVSRHTP QALRAINVSP PFLAGPYGHG AVRAAASRRG GAHACSVSST REHIVCSGGP 
SHNIVGFRRD EETECLVPRM AFSGHDDVVF DVGFIGRDAM ASASRDCTVK VWQLPKSPSY 
DEIRITPSGS VHPIGECTQN ERVRGVKVVD RCPARHLATC TSSGHVLQLD AETLSLVHSG 
YQCRGYLETC CLATDGQIVA VGSRTHIGFV DFRSKNFYAS VALPYGDTNS TRSLSFHEGG 
NLLTIGGGRG LISFYDVRMR KYLVDNGRGR VRQLFNNQYC VPFADNGIFE DEHDDDFYDI 
EIRDYCLPAI FAHQWDPSGT RLLCAGGPLQ SMLHGFFVGV WS