Gene OSTLU_37849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_37849
Symbol
ID	5005921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009370
Strand	+
Start bp	253969
End bp	255378
Gene Length	1410 bp
Protein Length	469 aa
Translation table
GC content	62%
IMG OID	640421342
Product	predicted protein
Protein accession	XP_001421892
Protein GI	145355280
COG category	[L] Replication, recombination and repair
COG ID	[COG1041] Predicted DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.00619482
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00164206
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTGCGGAG TGTCGAACGT GGAGGACTTG GCGTGGACGC GCGCCGACGG CGGCGACTGC 
GAAGAGACGC CGTTTTGGTA CGTCGAGCTC CCGGACGAGC GCACAGCGCG CGCGATCGCA 
TCGCGCGCGC TGTTAGTCAA AGCGATTTTA GAGGCGTGGG GTTCGGCGCC GGACGAGGGT 
GGGCTGCGGG ACGCGGTCGC GGCGTACGAC GAGTCGCGAA AGACGCCGTA TTTAGCGCCG 
GGGACGACGT TTAAGGTGGA GGTGGAGGAT TTCGGCGTCA GGCGCGGGTC GAAAGACATC 
TTAAAGCGCG TCGGCGACTT GGGATTGCCG TTTCTAGGGA AGGCGGATCT TAAGAATCCG 
GAACATTTAT TTTGGAGCGT GGTGAGCGAC ACGAAGGAGA CGCCGAGTTT ACCGCAAACG 
CCGCGGCATT GCTTCTTCGG GCGCGTCGTC GGTCAGAGCG ATCGCTCGAC GTTGAAAAGG 
TACGACTTGA AGCAACGTTC GTATTTAGGG CCGACGAGCA TGGACGCGGA GATGGCGCTT 
TTGATGGCGA ATTTCGCGCA GGCGCGTCCT GGCGGCGTGA TATTAGATCC GTTTTGCGGC 
ACGGGATCAA TGCTCGTCGC CGCGGCGCAT TACGGTGCGA TGACGATGGG CATAGACATA 
GACATTCGCG TCATCAAGCA TGGGAAATCG GCGCGCAAGA GCGGCTCGAA GTTTGGCGTA 
AAAGCGAGCG ATGGTTCGTC GGTGGACGTG TGGACGAATT TCGCGCAGTA CGGTTTGCAA 
CCGCCGGTGG CGTTGTTTGT CGGCGATTTG CACGCGTTGC CGACGCGACG GTTTGGTTTA 
GAGGGTACGC TCCAAGGTAT CGTCGCCGAC CCTCCGTACG GCGTCCGCGC CGGCGGACGC 
AAAAGCGGTG GGCGCAAACC GCTTCCCGAA GACTACGCCA TCCCGGAGGA GATGCGAGAA 
ACGCACATTC CGAGCACCGC GCCCTATCCA TTCGCCGAGA TGAACGACGA TTTGATGGAG 
CTCGCCGCTC GGTTTCTCTC CATCGGCGGC CGTCTCACGT TCTTCCTCCC CGGTTCCACC 
GAAGACGCCG AACGAGAGAT TCGCGACCTC CCCGCGCACC CGGCGCTTCG CCTGCGATGG 
CACTCTCTAG AAACCTTCAA CCAAATCTGG GGTCGCCGTC TCGTGACGTA CGAAAAAATA 
CACCCCTACG ACGTTGAAGT CGCGCGAAAG GCGCGCGAAG ACGCCGTCGC CGCCCGCGCG 
GCGAGCGACG AGCCGGATTT GATCGAACGG ATGCGCGCGT TGGTGTACGA CCAAGTCCCC 
GCCGAGGCGA AGCGTCGCAA GCGATACGAG AAATTCCACG GCGTGCCTCC GCCAGACGCG 
CTCACCGAGC GCGCGAGCGC AGAGACGTAA

Protein sequence

MCGVSNVEDL AWTRADGGDC EETPFWYVEL PDERTARAIA SRALLVKAIL EAWGSAPDEG 
GLRDAVAAYD ESRKTPYLAP GTTFKVEVED FGVRRGSKDI LKRVGDLGLP FLGKADLKNP 
EHLFWSVVSD TKETPSLPQT PRHCFFGRVV GQSDRSTLKR YDLKQRSYLG PTSMDAEMAL 
LMANFAQARP GGVILDPFCG TGSMLVAAAH YGAMTMGIDI DIRVIKHGKS ARKSGSKFGV 
KASDGSSVDV WTNFAQYGLQ PPVALFVGDL HALPTRRFGL EGTLQGIVAD PPYGVRAGGR 
KSGGRKPLPE DYAIPEEMRE THIPSTAPYP FAEMNDDLME LAARFLSIGG RLTFFLPGST 
EDAEREIRDL PAHPALRLRW HSLETFNQIW GRRLVTYEKI HPYDVEVARK AREDAVAARA 
ASDEPDLIER MRALVYDQVP AEAKRRKRYE KFHGVPPPDA LTERASAET