Gene OSTLU_28459 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_28459
Symbol
ID	5006392
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009372
Strand	+
Start bp	79055
End bp	80314
Gene Length	1260 bp
Protein Length	371 aa
Translation table
GC content	54%
IMG OID	640421813
Product	predicted protein
Protein accession	XP_001422295
Protein GI	145356138
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.00576497
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00149215
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

CGTCGACGAC CATGGCCTCC CCGTCGCTCG ATGCCGTGCG TTGGAGCGAA TACCGGGCGC 
TCATGCAAGC GTGGGAAGCG TTTAACCCAC ACAGGGAGCT CCTGCGTCGG TTTTTACAGA 
AGCAATCGCA CACGGAGCAG TGCCCACCCG GCGTCCCGTA CGTACCAGAT CTGCCGGAGC 
CGGAGTACTT CGCCGTGAAG AGACGAATCG AGGCCGGGGA AACCGTTCCA TGTCCTGGAT 
TCTTACGCGA ACGCGACAAC CGGCGCAATC AATGCCGCTG CGGGGCTCCA CTCAGAGTTG 
ATGACACTGG CAATATCTCC TGCACTTCCA AAATTCCCCG TCATGAGAAC TATGGTCCTG 
TACCTCGTTG CTGTTGCTGG GCCGAAGAAG AGCACGCTCG TAACCAACGA CATGACATGC 
CGCCGTATAT TTTAAGGCCG CCACCCATAG TGTCCCCCCC TCAAGTACCA CCGTCGTCTC 
AAGTGCTCTT GAGCTTTTTG GAGGGGGTCA GGCCAAGCAT GAACGCCAAC TACCTGCGAT 
GCGTTCAAGA CATAGACGAA GAGCTCGCTC GTCTGAATGA GCAGCTTGCG GACAACAGCA 
TTTCAACGAC GAGGCGTGAA GCGATTCAAC AGCATATAGT GAGCGAACGC TCCAAACTTG 
AGGCCAAAGA CACACAGTTA CAAGATTTTT TTAACACGAC GACCGCACTG GCAGAATCCG 
TGCACACGTT CGAGCACAGA GTGGCAGAGA AATACCAGAA AGCTGTGGAT GCATACATTA 
AAGCGCAACT GGATGAAGTG GTCGTACCTC CGGATAGTAG AGGGAATCCA AAGTTTAAGG 
ACTCAGTCGA TGGCATCGAC AGAGAGTTGG CCAAGTTAGA ATCAGAAAAT GGAGGCATCT 
CCAACGACAG CGCTCGCGCT CGCGTCGCCT CCAAACGTAA GAGCGTGGAA GAGTGTGAAT 
CAGAGCACAA GCGCCTCAAA ACCACTTCGG TTGAGTACAA CTTGTCTATT TTGAAAGGGA 
GTTTGGAAAA AGACAAATCT ATGTCTGCTG AAGACAAAAG ACGCTGGGAA TGCGTCATAA 
ACGCCGTCGG GTTGTTACGA GCAAACGATG CACCAAGAAC GCCGTAGCAA CAGTATGGGC 
AAACAGTTAG GCGTTCTCCA TGGCCTCCAT TCGCGCGACC AGAGCGTTGA CGCGCTCTTC 
GAGTTCGTCG ATGCGGCGTT GTTTAGCGTC GTTCGCGCTC TCTACATCGG CGCGACATAG

Protein sequence

MASPSLDAVR WSEYRALMQA WEAFNPHREL LRRFLQKQSH TEQCPPGVPY VPDLPEPEYF 
AVKRRIEAGE TVPCPGFLRE RDNRRNQCRC GAPLRVDDTG NISCTSKIPR HENYGPVPRC 
CCWAEEEHAR NQRHDMPPYI LRPPPIVSPP QVPPSSQVLL SFLEGVRPSM NANYLRCVQD 
IDEELARLNE QLADNSISTT RREAIQQHIV SERSKLEAKD TQLQDFFNTT TALAESVHTF 
EHRVAEKYQK AVDAYIKAQL DEVVVPPDSR GNPKFKDSVD GIDRELAKLE SENGGISNDS 
ARARVASKRK SVEECESEHK RLKTTSVEYN LSILKGSLEK DKSMSAEDKR RWECVINAVG 
LLRANDAPRT P