Gene OSTLU_51391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_51391
Symbol
ID	5005426
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	-
Start bp	621526
End bp	624847
Gene Length	3322 bp
Protein Length	645 aa
Translation table
GC content	60%
IMG OID	640420847
Product	predicted protein
Protein accession	XP_001421518
Protein GI	145354493
COG category	[R] General function prediction only
COG ID	[COG1524] Uncharacterized proteins of the AP superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.644512
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCGTC GCGGTCGCGA CGGCGATGCG TCGCCGGCGC GTCGGACGCG CGCGTGGACG 
CTGGCGACGG CGATGAAGTT TACGGCGCTG CGACTGTTCG CGTCTGGGTT TCTGCTCGCG 
CGCGTGGAAT CGCCGTCGAG GGCGACCGCG AGGCCGGACG CGGCGCGCGC GATCGTCGAT 
AAGGCGGTGG TGCTCGTCGT CGACGGCGCG CGGCACGATT GGACGACGGC GACGAGGGAC 
GAGGGCGACG AGGCGCGGCG GCGGTTGAAA CTGCCGAGCG CGAGACGATA CGGGGGGGGG 
AGGCGGTGCG AAGACGCGAC GAACGAACGA GGACGAGGGA TGGTGTTTAA ATTCATAGCG 
GACGCGCCGA CGACGACGCA GCAGCGGTTG AAGGGATTGC TCACGGGAGG GTTGCCGACG 
TTTATCGACG CGAGCGCGTC GTTCGGCGGG ACGACGCTCG GGGAAGATAA TTTGATCGAA 
CAGTTGAGCG CGAATGGACG ACGGATGGCG ATCAGTGGGG ACGATACGTG GAGCGAACTT 
TTCGACGTGA ACGCGACGTT TCGGGCGGGG GCGGCGATGT ATCCGAGCTT TGACGTGAAG 
GATACGGAGA CGGTGGACGC CGGCGTGCGC GCGTCGATGG CGGCCGCGTT GCGCGCGCCC 
GATGACTGGG ACGTTTTGAT AGGGCACATG CTCGGTGCCG ATCACGTCGG CCACACGCAC 
GGGGCGACGA CGGATTTCAT GCGCGCAAAG TTAGAGGAGA ATGATCGAGA TATCGAGAAC 
GTAGTCGAGG CGATGCGAGC GGACGAAAAG TACGCCGACG CGATGGTGTT CGTGTTCGGC 
GATCATGGGA TGACAGACAA CGGAGACCAC GGCGGTGGGA CGCCCGAGGA GGTGGAGTCT 
TTCATGCTCG CGTATCACCC CTGGGCGAAA GGTGAGAACT GTGGGAACGG CGACGGCGAA 
GACGACGATG ATTTCCCACA GATTGACTTC GCGCCGACGA TGGCGACGCT TCTGGGCGTG 
CCCATACCGC ATGGAAATTT AGGAAAGGTG AACGAAAAAG TATTCAATCT CGCGCACGAG 
GGGAAACGCG CGAGTGGGCG AGGCGATGTG TTCGCCGCTT ACGTGCGCGC GATGCACGCG 
AACGCGGAGC AAATTTGGAC GTACGTTCAA TCGTACGGCG ACGGCAAGAC GAGTCCGTTT 
GGTGCCGAAC ACACCACGCG CCTCGCGGCG CTCATGAAGG TGGTGCGAGC GAATAAATCT 
GTAGACACGA CAGAGTTTGT GCTGGATTTC ATGAATGAGG TGGCAGAATT GGCGCGCGCG 
AAGTGGGCAC AATTCGGATT GTTGAGCATG ACGGTTGGTT TCATCGCGCT CGTCGTCACG 
CTCACGGCGC ACGCCGTGCT CGCGTACGAC AAAGTCGACG ACGCGCGCGA TGGAGATTTA 
GATCTTATGA TCGCGCGCGT CGGTGTATTT ATGGTGATAT TAGCGTCCGT GGCACGATTA 
TCGAATAGTT TCGTGGTGCA AGAGCGCGAG ATGATGCAAT TTCTCTTCGC CACGTTCATC 
GTCGCCGCGA TGTTTGGGAG ATTCACACGA GGTCAAGCGG GGGTCTTGCA AAGTGGATGC 
AAGTGCCTTT TTGCTAACGG TGCGCTTTAT GTTTTAGGAG TGTCGTGGGT GAAGAGTGAC 
TCGACGGCGA TCGCGTCGCC CGCGATCACC GTCGTCATCG CAACGTGCGG GCTCGTCGTC 
GTCATCGTCG CTTTGAACGC GATTCGTCGC CATGCGTCGA TGGCGTCGTA CAATGGTAAG 
TTACGCGTCG TCGACATCGC ATCGTGCGCC TGGCTCACCG TGGCGATTCG GAGCGTGCAA 
ATTTTAGTTT TCAAAGGCGA AGGAATCGCG CTCGCCCGTG CGACGTACGC GCTTTCAATC 
GCAGGCGCTG TGGCGAACGG GATCGAGACG TCGACGCGGT CGCCGTCGGC GAACGTCGCA 
CGTCTTCTGC GAGTTTTCAT ACTCTCAGTC GCACCGACGA TCGCCATGCT CGCCGGACCA 
ATCCTAGGCG TCGCGTACGT AGCGCTGACA TACGTCTTGT ACGACGGTTT GCTCAGCCTC 
TTGGTCGACG CGTCGCCGCG CTCGAAAGGC ACGGAAACTG TCGTCGCCAG TGGACTATGG 
CTCGCGAGCA CGGTTGTATT TTTTGGTGGA GGACACACGT GCTCGTTTGA CGGTTTACAC 
TTCGCCGTCG CGTTCACCGG CTTTCGCAAA TTCAACTTTT ACGGCATGGG ATTTCTCCTC 
GGCTTTGAAA CGTGGAGTGG TGAAATCATT CTCGCCGTCG CCATTCCGCT CTTCGCGTTC 
GCTATGACTC AAAATGAACC ATACGAGTCT TTCCAACGAT TGACCGTGCG CGTATCGATG 
AAAGTCGCGC TCTTCCGCGC ATTCGCGGCG ACGTGCGCCG CCCTGTGCGC CTTCATCCAC 
CGTCGACATT TGATGGTTTG GGCGATTTTT GCGCCAAAAT TCGTCTTCGA CGCCATCGGT 
TCCACCGTCG CCGACGTTTG CGCCATCGTC GCCGTCGCTT CATCTTTCTC TAGGCATCCT 
TTAGAGCGCG TCAAGCGCGA GTGATGCGAC GTTCGCTGTA TTATTATGTT CTCTCGCGAG 
TCCCGACGCC CCGACGGCTG CCCAAAACCT CAACCTCATT TCGGGACACC GATTTTCGCG 
ATGTTTAAAC CGATCACCCG CGAGCTCAAG CTCGCGCACG GCTCGCGACG CGAGCGTCGC 
CGCGTCTCGC GCGCGACGGA ATCGCGCCTG CGCCCCGGGC GACAGGGCGT GCAACGAATC 
TATCGCCTGA CCCAGGAAAA GGAAATGATT GGCGAGTACG AATACCTCGA GTCCATCGGC 
GTCCCCAGGG CGCAGGCGCT GCAAGTCATG TCCCGAGCGT CCACAGCGTT CGAGCGCGAG 
GCGGTGCGAC GAGGCCAAGA CCCGAAAGCG ATGAAATTCG GCGCGGAAGA GATGCGAGAG 
GTGGTGGAGT TTCTGAAGGC GAGCGGCGTG AAGGAGGACG CGGTTGGATT TTTAGTCATA 
CGTAATCCCG CGGTGTTGGC GTACGACGTG GAGAAACGAT TGAGACCGTT GTTTGAGTAC 
ATGGAGGCGA CGTTCGAGCG GACGGCGGAG ATGTTTGTGG ATGACGTGAC GAAGCGGCCG 
AGCTTGCTCG GGTTGGACGC CAACGAAAAC GCGAAAAAGA TGGTGGACTT TTTGTTATCC 
ACGGGAAGCA CGAAGGAAGA GGCGGTGGAG TATTTATTGC GAACGCTTTA GGACTCGATG 
TCGAGCGATT GATGATTAGC AG

Protein sequence

MRRRGRDGDA SPARRTRAWT LATAMKFTAL RLFASGFLLA RVESPSRATA RPDAARAIVD 
KAVVLVVDGA RHDWTTATRD EGDEARRRLK LPSARRYGGG RRCEDATNER GRGMVFKFIA 
DAPTTTQQRL KGLLTGGLPT FIDASASFGG TTLGEDNLIE QLSANGRRMA ISGDDTWSEL 
FDVNATFRAG AAMYPSFDVK DTETVDAGVR ASMAAALRAP DDWDVLIGHM LGADHVGHTH 
GATTDFMRAK LEENDRDIEN VVEAMRADEK YADAMVFVFG DHGMTDNGDH GGGTPEEVES 
FMLAYHPWAK GENCGNGDGE DDDDFPQIDF APTMATLLGV PIPHGNLGKV NEKVFNLAHE 
GKRASGRGDV FAAYVRAMHA NAEQIWTYVQ SYGDGKTSPF GAEHTTRLAA LMKVVRANKS 
VDTTEFVLDF MNEVAELARA KWAQFGLLSM TVGFIALVVT LTAHAVLAYD KVDDARDGDL 
DLMIARVGTE TVVASGLWLA STVVFFGGGH TCSFDGLHFA VAFTGFRKFN FYGMGFLLGF 
ETWSGEIILA VAIPLFAFAM TQNEPYESFQ RLTVRVSMKV ALFRAFAATC AALCAFIHRR 
HLMVWAIFAP KFVFDAIGST VADVCAIVAV ASSFSRHPLE RVKRE