Gene OSTLU_36787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_36787
Symbol
ID	5006909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009375
Strand	-
Start bp	249543
End bp	250976
Gene Length	1434 bp
Protein Length	477 aa
Translation table
GC content	60%
IMG OID	640422330
Product	predicted protein
Protein accession	XP_001422939
Protein GI	145357465
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID	[TIGR00591] photolyase PhrII

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	0.00684152
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.00249943
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACGACG CGGCGAAGGC GGCGTTGGAT GCGTCGGCGC GCGCGCGCGC GAGCGCGAGC 
GCGAGCGCGA GCGCGGGGCC GGTGGTGTAC TGGTGCGACC GGGACAGGCG GTGCGCGAAT 
AACGACGCGC TGGGACGAGC GATGGAATTG GCGAACGAAA GGCGCGTCCC GCTCGTCGTG 
GCGATGCACG TGGGGACAGA TTTGAGCGGG AGCGGCATCG GAGGCGCGCG CAGGGCGGTG 
TTCGCGCTGA AGGGGTTGAA GGAATTGGAT GAGGATTTGC GAGCGCGAGG AGTGTCGACG 
CGAACGACGA CGGGAAGCGA CGTCGCGGGA GGAATCGTGG AGACGTGCGA GACGCTGAAT 
GCGAGTGCGG TCGTGTGTGA CTTTTCGCCG TTGCGAGAGG GGCGTGCGGC GAGGGAAGCG 
GTGGCGCGTG TGGTGGAGGT TCCGGTGATT GAAGTGGACG CGCACAACGT CGTGCCGGCG 
TGGGTGACGA GCGATAAGCA AGAGTACGCG GCGAGAACGA TTCGGCCGAA GATTCATCGA 
AATCTCGGGG ATTTTCTCAC CGCACCGCAA GCGTTAGATG ATCTCATCGC CGCGCCGGAC 
GCGTTGACGC CAAGTGAGAC GGATTGGGAC GCATTGATTG ACACCGCGCG CGTCAAGGGC 
GCGCACGTCC CAGAGGTTGA CTGGATCAAA CCGGGTGAAC GTGCCGCCTT AGCCGCGCTG 
CTCGATCCGA ATGTCGACTC TTTCCTCCCA CAGCGATTGA CACTCTACGG GGAGCGAAAC 
AAGCCGACGT CGCCGCGCGC CGTGTCTCGC CTCTCGCCGT ACTTGAATCA CGGCCAGCTG 
TCGCCACGTC GCGCCGCGTG GGAAGCTGCG CAACTTCGGG GAATCGTAGA CGACGAGGCG 
ATCGATAGCT ACTTGGAAGA GCTCATCGTT CGAAGGGAAT TATCAGACAA CTATTGTCTC 
TTCAATCCGT ATTACGACTC GTTGCAAGGA GCGAGTCAAT GGGCGCAAGA TTCACTGAGT 
TTGCACGCCC GCGACGTTCG CGAGTACGTG TACGATTACA AAACACTCGA GCGTGGCAAC 
ACGCACGACG AGCTTTGGAA CGCGGCTCAG AAAGAATTAT ACCATCTCGG ACGAATGCAT 
GGGTTCATGA GAATGTACTG GGCGAAGAAG ATTCTTGAGT GGACGCCGTC GCCGGAGGTG 
GCCCTGCAGA CGGCGATTCA ACTCAACGAC GCTTACGCGT TAGACGGTCT CGATCCCAAC 
GGCTACGTTG GTTGTATGTG GAGCATTGCC GGTGTGCACG ATCAAGGATG GAAAGAGCGC 
GCGGTGTTCG GTAAAGTGCG GTATATGAAT TACGCCGGTT GCAAGAGAAA GTTTCAAATC 
CAAGATTACG TAGCGGCGGT CGACGCTGAG ATAAGCGGAA TAGGTCGCAA ATAG

Protein sequence

MNDAAKAALD ASARARASAS ASASAGPVVY WCDRDRRCAN NDALGRAMEL ANERRVPLVV 
AMHVGTDLSG SGIGGARRAV FALKGLKELD EDLRARGVST RTTTGSDVAG GIVETCETLN 
ASAVVCDFSP LREGRAAREA VARVVEVPVI EVDAHNVVPA WVTSDKQEYA ARTIRPKIHR 
NLGDFLTAPQ ALDDLIAAPD ALTPSETDWD ALIDTARVKG AHVPEVDWIK PGERAALAAL 
LDPNVDSFLP QRLTLYGERN KPTSPRAVSR LSPYLNHGQL SPRRAAWEAA QLRGIVDDEA 
IDSYLEELIV RRELSDNYCL FNPYYDSLQG ASQWAQDSLS LHARDVREYV YDYKTLERGN 
THDELWNAAQ KELYHLGRMH GFMRMYWAKK ILEWTPSPEV ALQTAIQLND AYALDGLDPN 
GYVGCMWSIA GVHDQGWKER AVFGKVRYMN YAGCKRKFQI QDYVAAVDAE ISGIGRK