Gene OSTLU_24552 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_24552
Symbol
ID	5001839
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009359
Strand	+
Start bp	351838
End bp	353004
Gene Length	1167 bp
Protein Length	314 aa
Translation table
GC content	60%
IMG OID	640417260
Product	predicted protein
Protein accession	XP_001417743
Protein GI	145346537
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.647272
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.779721
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGGCGCGCGC GCGCGCTCGA ACGTCGGTGA CGATGAGCGA AACGGCGACG GTGACGTACC 
TGGAGAAATT CGTGGACAGT GCGTGCGCGA GAGCGAGGCG AGAGCGAGGC GAAGGGTGAA 
ATTTCGCTCG GACGACCGAG GACGATCGAG CTCGAACGCG AAGACTGACG ATCGTTACGC 
GCGCGTCGTG ACGTAGATCT CGCGGACGTC CCCGCGGAGT TGCAGCGGAT ACTACAAACG 
ATCGGGGAGC TCGATAAACG GAACGTGCGA TTGCGAGATG CGGTGCAAGC AAAGGTGGAC 
GAGTGCGCGT CGGCGCCGAG TCTGAGCGCG CGAGGCGCGC GCAGCGCCGA CGTCGACGCG 
GTGAGCACGT TGAAGAAAGA GATCGAAGAA CTTCACGATA CGATGGCGAT GGTATCCAAT 
GAGAAGATAC GGTTGGCGCA GATGGCGTTG GATTTAGTGA AAGGGAACGC GACGGTGCTC 
GACGCTGAGA TGAAGACGTT CCGCACAGAG CTCGAGGAAC AAGGTATTAA CCCGGACGAG 
GACGTCGATG ATGGGTACGG CTACGCGCAG GTGCAAGCGC AGTACCACCG CAAGATGCAA 
AAGCCGCAAT ATCAATATCA AAGACCCGCG CCTATGCCGC AGCAGCAGCG CGCGTACGGC 
GAACACGCGA TGAGCTCGAT GGACGTCGGC GACCTCGTGG CGGCAAACGT AGGGGCGTTG 
AACCAAAGCG CCGGTGGACA AGAGTGGATC GTTGCGACCG TGACTCGATA TTCTCCAACT 
GAACGCGAGT TTGAGATCGT TGATGCGGAC GAAGACGCGG AAAAGCACGT GTACCGCTTG 
CCGCAAAAGT TTGTCATCCC GCTTCCGAAG ACGGCGTCTG TGAAGCAGTC GCAAAACTTT 
CCCGCCGGGA CGAGCGTGCT CGCTGTGTAC CCGAACACGA CCACGTTCTA CAAAGCCAAG 
GTCGTGCAAC CGGCGAGAAG ACTCCCGAAC GCGGAGTACA GCGAGTTCGT GTTAGAGTTT 
GAAGACGACG GCGACGCCGA CGGTCAAGCG CATCGCCCCG TGCCGTTCCG CCACGTCGTC 
TTATTTCCGC GATGAGCGGT GCGAGCGGGA ACACAGTTTC GCGCGATCGA TCGATCGTGC 
GTGCGCGCTA TTTCGTGTAA TCAACAG

Protein sequence

MSETATVTYL EKFVDNLADV PAELQRILQT IGELDKRNVR LRDAVQAKVD ECASAPSLSA 
RGARSADVDA VSTLKKEIEE LHDTMAMVSN EKIRLAQMAL DLVKGNATVL DAEMKTFRTE 
LEEQGINPDE DVDDGYGYAQ VQAQYHRKMQ KPQYQYQRPA PMPQQQRAYG EHAMSSMDVG 
DLVAANVGAL NQSAGGQEWI VATVTRYSPT EREFEIVDAD EDAEKHVYRL PQKFVIPLPK 
TASVKQSQNF PAGTSVLAVY PNTTTFYKAK VVQPARRLPN AEYSEFVLEF EDDGDADGQA 
HRPVPFRHVV LFPR