Gene OSTLU_41733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_41733
Symbol
ID	5004960
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009367
Strand	+
Start bp	277493
End bp	278926
Gene Length	1434 bp
Protein Length	477 aa
Translation table
GC content	60%
IMG OID	640420381
Product	predicted protein
Protein accession	XP_001420955
Protein GI	145353298
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID	[TIGR00591] photolyase PhrII

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	0.908244
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.188048
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGACG CGGCGAAGGC GGCGTTGGAT GCGTCGGCGC GCGCGCGCGC GAGCGCGAGC 
GCGAGCGCGA GCGCGGGGCC GGTGGTGTAC TGGTGCGACC GGGACAGGCG GTGCGCGAAT 
AACGACGCGC TGGGACGAGC GATGGAATTG GCGAACGAAA GGCGCGTCCC GCTCGTCGTG 
GCGATGCACG TGGGGACAGA TTTGAGCGGG AGCGGCATCG GAGGCGCGCG CAGGGCGGTG 
TTCGCGCTGA AGGGGTTGAA GGAATTGGAT GAGGATTTGC GAGCGCGAGG AGTGTCGACG 
CGAACGACGA CGGGAAGCGA CGTCGCGGGA GGAATCGTGG AGACGTGCGA GACGCTGAAT 
GCGAGTGCGG TCGTGTGTGA CTTTTCGCCG TTGCGAGAGG GGCGTGCGGC GAGGGAAGCG 
GTGGCGCGTG TGGTGGAGGT TCCGGTGATT GAAGTGGACG CGCACAACGT CGTGCCGGCG 
TGGGTGACGA GCGATAAGCA AGAGTACGCG GCGAGAACGA TTCGGCCGAA GATTCATCGA 
AATCTCGGGG ATTTTCTCAC CGCACCGCAA GCGTTAGATG ATCTCATCGC CGCGCCGGAC 
GCGTTGACGC CAAGTGAGAC GGATTGGGAC GCATTGATTG ACACCGCGCG CGTCAAGGGC 
GCGCACGTCC CAGAGGTTGA CTGGATCAAA CCGGGTGAAC GTGCCGCCTT AGCCGCGCTG 
CTCGATCCGA ATGTCGACTC TTTCCTCCCA CAGCGATTGA CACTCTACGG GGAGCGAAAC 
AAGCCGACGT CGCCGCGCGC CGTGTCTCGC CTCTCGCCGT ACTTGAATCA CGGCCAGCTG 
TCGCCACGTC GCGCCGCGTG GGAAGCTGCG CAACTTCGGG GAATCGTAGA CGACGAGGCG 
ATCGATAGCT ACTTGGAAGA GCTCATCGTT CGAAGGGAAT TATCAGACAA CTATTGTCTC 
TTCAATCCGT ATTACGACTC GTTGCAAGGA GCGAGTCAAT GGGCGCAAGA TTCACTGAGT 
TTGCACGCCC GCGACGTTCG CGAGTACGTG TACGATTACA AAACACTCGA GCGTGGCAAC 
ACGCACGACG AGCTTTGGAA CGCGGCTCAG AAAGAATTAT ACCATCTCGG ACGAATGCAT 
GGGTTCATGA GAATGTACTG GGCGAAGAAG ATTCTTGAGT GGACGCCGTC GCCGGAGGTG 
GCCCTGCAGA CGGCGATTCA ACTCAACGAC GCTTACGCGT TAGACGGTCT CGATCCCAAC 
GGCTACGTTG GTTGTATGTG GAGCATTGCC GGTGTGCACG ATCAAGGATG GAAAGAGCGC 
GCGGTGTTCG GTAAAGTGCG GTATATGAAT TACGCCGGTT GCAAGAGAAA GTTTCAAATC 
CAAGATTACG TAGCGGCGGT CGACGCTGAG ATAAGCGGAA TAGGTCGCAA ATAG

Protein sequence

MNDAAKAALD ASARARASAS ASASAGPVVY WCDRDRRCAN NDALGRAMEL ANERRVPLVV 
AMHVGTDLSG SGIGGARRAV FALKGLKELD EDLRARGVST RTTTGSDVAG GIVETCETLN 
ASAVVCDFSP LREGRAAREA VARVVEVPVI EVDAHNVVPA WVTSDKQEYA ARTIRPKIHR 
NLGDFLTAPQ ALDDLIAAPD ALTPSETDWD ALIDTARVKG AHVPEVDWIK PGERAALAAL 
LDPNVDSFLP QRLTLYGERN KPTSPRAVSR LSPYLNHGQL SPRRAAWEAA QLRGIVDDEA 
IDSYLEELIV RRELSDNYCL FNPYYDSLQG ASQWAQDSLS LHARDVREYV YDYKTLERGN 
THDELWNAAQ KELYHLGRMH GFMRMYWAKK ILEWTPSPEV ALQTAIQLND AYALDGLDPN 
GYVGCMWSIA GVHDQGWKER AVFGKVRYMN YAGCKRKFQI QDYVAAVDAE ISGIGRK