Gene OSTLU_29301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_29301
Symbol
ID	5006690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009374
Strand	+
Start bp	19272
End bp	20919
Gene Length	1648 bp
Protein Length	548 aa
Translation table
GC content	59%
IMG OID	640422111
Product	predicted protein
Protein accession	XP_001422452
Protein GI	145356470
COG category	[A] RNA processing and modification
COG ID	[COG5183] Protein involved in mRNA turnover and stability
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.106062
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGACGC GCCGACGCGC GCGCGCCTCG CCGACGCGCG AGAAAACGAC GACCGAGGAA 
GATGCCGACG CGTGTCGGTT TTGTTTCGAA AGCGCGCGGG AAGACGACCC GTTGATCGCG 
CCGTGCGCGT GCAGAGGAGG ACAAGAGTAC ATACACGCGA AGTGCTTGCT TCGATGGCAG 
CGCATGGTGG TGGTGCAAGC GCCGACGCAT CCGGCGTTTT GGAACGAGGA CACGCGGAGC 
AACGTGTGCA ACGTGTGCAA GGAGGCGTTT ACGACGCCGC CGCCGACGCG AATGACGCTG 
ATGAGCTCGT TCACGGGAGC GGAGATCGCG GCGATGTGCG CCGTCGGGCA CTTGTTGGTG 
TCGCACGCCG CGTTTAGCGC CAAACTTCGA GAGAAATTGC AAGACATGAA CCCGGCGATG 
CGGCGGATTT GCTCGTACGA GTACTGGATC GAAGGGACGT ACTTGATCAC GGAGACGCGC 
GCGTCGTCGG ACGAAGCGGG GGAGTCGAGC GAAGGAGACG TAGGCGATGA CACAATCGTG 
GCGGTGAACT TGAACGGGCG ATGCGACGTG AGTGAGTTCA TCCAGGGCGA AAGTCAGTTG 
TTTGAGATTG TCGGCGCCGG CGGACAATCT CGCGTGCGCT TGCGCCAAGA ATTTGAAGAA 
GGAAACGATG ACGATGACGA CAATGATGAC GACAATGATG GCGATAATGA TGACGACAAT 
GATGACGATA ATGATGACGA CGAACGAAAT ACGGCAGACG TGGATGACGC AGACGTGACG 
AACGAGGACG CCGACGAGGA CGATTTGCCC CGAGACGAAA TCGCCGACGA CGCAGAGCAA 
ACACCGGAAC TTGTCATCGA AGTTCCCGAA GACGTTGCTG ACGATCGAGA GGCGTTTATC 
GAGCACCTAC AACAGCTATT ATCACCGTCC ATTTTTGAGG TGTATCAGCG ATTTCGCAGG 
CGGCGAGTCA TCGAGGACGC CTACGACGAA GTCGCCAGGG AATGGCGAGT CACGCGCCAG 
GACGTCGAGA ACGCGGTTGA GATAGAGCCG TTCGATGGTG GACCGTGCGA TCACGACGAA 
GTCGCGTTGT GCATTGTCGT CGGTACGGAC ACGTCGTGCG GCTACACGAA AGTCGAGGGA 
AGTTTGGCGG GCGCCATCAG CGTAGCGTTT AGAAATTCTC GCGCGTACGC CGACTCGACC 
GACGGTTTGC GAGCGGGTGC CGTCGTGACA TGCGCCGCAA CCGCCGACGT GCGCGAGGCC 
GTTGGCGTTC TGTGCGGGTT TTCGGAAGAA TCGAACACGT GGAACGTCGC TTCGCCTTTC 
GGCGTGCTGA AACGAACTCG AGAGGAGTTC GAGGTTCTTC GAAGCCCGAC GCGCGCCAAA 
GTGCTCTGCT TCTTCGGCAC CGCGCAATGG AACCGATCGC AACTTTTGGG TGAAATCGCG 
AGAGGACACT GGGGGTTGAC GAAATCAGAG CCCGTCGACG TGGCGCGCGC AGAAACTGCG 
TATCGCCGCG CGATGGATTC TGGATCGCTC GTGTTTGCGC CGTTGACTGA AATGACGGAG 
GAGTTTATGC GCGACGAACT CGCAGAGATG TCGCGCATTC GATCGAGCGG TCAGCTCGAC 
CGCGCGGGGT CATCCGCGTC CCACTGAT

Protein sequence

MSTRRRARAS PTREKTTTEE DADACRFCFE SAREDDPLIA PCACRGGQEY IHAKCLLRWQ 
RMVVVQAPTH PAFWNEDTRS NVCNVCKEAF TTPPPTRMTL MSSFTGAEIA AMCAVGHLLV 
SHAAFSAKLR EKLQDMNPAM RRICSYEYWI EGTYLITETR ASSDEAGESS EGDVGDDTIV 
AVNLNGRCDV SEFIQGESQL FEIVGAGGQS RVRLRQEFEE GNDDDDDNDD DNDGDNDDDN 
DDDNDDDERN TADVDDADVT NEDADEDDLP RDEIADDAEQ TPELVIEVPE DVADDREAFI 
EHLQQLLSPS IFEVYQRFRR RRVIEDAYDE VAREWRVTRQ DVENAVEIEP FDGGPCDHDE 
VALCIVVGTD TSCGYTKVEG SLAGAISVAF RNSRAYADST DGLRAGAVVT CAATADVREA 
VGVLCGFSEE SNTWNVASPF GVLKRTREEF EVLRSPTRAK VLCFFGTAQW NRSQLLGEIA 
RGHWGLTKSE PVDVARAETA YRRAMDSGSL VFAPLTEMTE EFMRDELAEM SRIRSSGQLD 
RAGSSASH