Gene OSTLU_32072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_32072
Symbol
ID	5002168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009360
Strand	+
Start bp	224618
End bp	225786
Gene Length	1169 bp
Protein Length	381 aa
Translation table
GC content	55%
IMG OID	640417589
Product	predicted protein
Protein accession	XP_001418185
Protein GI	145347465
COG category	[S] Function unknown
COG ID	[COG4886] Leucine-rich repeat (LRR) protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.186816
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.540489
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGCGCGCGCG ACCGAGCGCA TCGATGTTCT CGTCGTTCAG CATCACCGGT GCGGCGGCGG 
AGGTGTACGA CGTCGAACTC GCGTACGAAG ACGCGCGTCG CGGGCGACGC GACGGCGAAA 
AGGCGTCGAC GACGACGACG ACGACCGAGG TGACGTTCGA CTCCAAGGAG GATCCCGAGG 
AGGTGATTGA TAAACTCGTG AAACAGCGAC GAGATCTGCC GTACGAGACG GGATACGAAT 
GCGTCGTCAT CCGAGCGCTT TGCTCGGCGT CGAAAGTCGC GATACAGCTC GGGGTGGAGA 
AGTATCAACC GAGACCGGTG GCGTTGAAGG TGACTTCGAA TGGAAAGATG AACGCGGGAC 
AGTCGCACTC GAGCTTGGCG TCGGTGCTCA AGCACTGTCA GCTCGGCTCG CTGCGGAAGC 
TGAGCGTGCA AGATGGATTG TTGTCCACGG TTTTGTCTTT ACGAGATAAA TGGACCTCGG 
TTCGAGAGTT GGACATTTCG AACAACGCGT TGGAAACGCT GCCGAAAGAG CTGTTCGCGC 
GTTTCCCGTA CCTGGAGGTT CTTCGTTTGG ACGGGAATAA ACTCGCGACT TTGCCCAACT 
TGAACGCGTT CACGCTTCTC AAAGAGTTGC ATGCGAACGG CAACGCGTTG TCAACGCTGC 
CAATCGACAT GGTGGAAGAT TTGGATTTGG AAGTTTTGTC CGTCGAGTTC AACCGCTTGA 
GCAAGCTGCA CGTCAAGTTG AAGGATTTGT CCAAACTGCG CGTGTTGCGG TTACTTGAGA 
ATCCCATAGA GACGCTGCCC CGGTTGAATA AGACCGCCAA TCAAGAGTGC TTATCGCTCG 
CAAACGTGAA TGTTTCGAGG AATGGAGCAA CAGGCGGTGT CTCCGTACAG GTTCGCGAAA 
CGAGCTCGTC TTACTTTTCC AGCATAGTAG GCGGCAAGAC AACGTCCAAG GAAAAAGCGT 
ACAACGCTTT CCTGAGCTTG ATCTTTCGTA GCAGTGAATG TCAAAACGCA TTACTCGTCG 
CCGCCGTCGC GGTGATCGCG TCGAAGAGCC GAGAAAACTG CGAAGCCATA GTGCTGACCG 
AAGGTGCGAG CGTTCGACCG CTTCTTCACT CTGGGGAAAA TTTACATGTG AAACTGACCG 
TACGTCCGTC CGCACCACAG GAGCCGTGA

Protein sequence

MFSSFSITGA AAEVYDVELA YEDARRGRRD GEKASTTTTT TEVTFDSKED PEEVIDKLVK 
QRRDLPYETG YECVVIRALC SASKVAIQLG VEKYQPRPVA LKVTSNGKMN AGQSHSSLAS 
VLKHCQLGSL RKLSVQDGLL STVLSLRDKW TSVRELDISN NALETLPKEL FARFPYLEVL 
RLDGNKLATL PNLNAFTLLK ELHANGNALS TLPIDMVEDL DLEVLSVEFN RLSKLHVKLK 
DLSKLRVLRL LENPIETLPR LNKTANQECL SLANVNVSRN GATGGVSVQV RETSSSYFSS 
IVGGKTTSKE KAYNAFLSLI FRSSECQNAL LVAAVAVIAS KSRENCEAIV LTEGASVRPL 
LHSGENLHVK LTVRPSAPQE P