Gene OSTLU_41525 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_41525
Symbol
ID	5005146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009367
Strand	-
Start bp	227129
End bp	228529
Gene Length	1401 bp
Protein Length	466 aa
Translation table
GC content	56%
IMG OID	640420567
Product	predicted protein
Protein accession	XP_001421091
Protein GI	145353588
COG category	[L] Replication, recombination and repair
COG ID	[COG1112] Superfamily I DNA and RNA helicases and helicase subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0000217661
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0334974
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTTGA AGGAAGTGCG AGAGCCGTTG AACCCAAGCC AGCGCGTCGC CGTGAAAAGC 
GCGCTAAGCT CTTCGCTCGC GGTTTGGCAA GGTCCGCCCG GTACGGGTAA GACTCGCACG 
CTCATAGCGT ACATCGGTGC TGCCGTACAC CTGGCGTCCA TCCAAAAGAG GCGAGGAAGG 
GGTCCGATCG TTCTCGCTTC CGCTGCGTCG AACGTAGCCG TGGATAATAT CCTCGAAGGA 
CTGGCAAAAG AATCTTTCAT CGTCGATGGA CGACCGCTGC GAGTCGTGCG CGTGGGAGCG 
CCCGCAAAGG TGCAACCTTG GCTTCAGCAA CTCACGCTGG ATGCTCAAAT CGCGTTGCAC 
CCTCTCGGGC GTCAAGCGGC GGCCATGCGT GAAGCTATCC GAGGACAATC TGGTCCAGCG 
TTTGCTCGCC AGCGCAAGCA AGCGACGCAG TTGGAACTGA CGGCTGCGAA GAGCATATTA 
AAGTCTGTGG ATGTCGTGTG CACCACATGC GTCGGCGCAG GCGACGAGTT ACTGGAGGAC 
TTCACGTTCC CAGTGGCTGT CGTGGATGAG GCGACACAAT GCACCGAACC AGGAGCGTTA 
ATCTCTCTCA CGAAAGCCTT GAGCGCCGTG CTCGTGGGTG ATTCCAAGCA ATTGCCTCCC 
ACGGTGGTGT CTCGTGACGC CGTCGACGCT GGCTTACAAG TTTCAATCTT TGAGCGCATG 
GAGAGGCTCG GGGTGAAGGT GTCTTTGCTA GACATGCAGT ACCGCATGCA TCCGCAAATC 
GCCGAATTTC CGTCTCTGGC GTTTTACAAA GGGAAAGTAG GATCGGTACC GACGCCGCAA 
GATCGTCCGT TGGTGCCGGG TATCGCTTGG CCGTCGCCGA ACGTTCCAGT AGCCTTCGTA 
GAAATCTCCG CCCCTGAATC GCGAGCACCC GATGGAAACA GTCTGTATAA CGTCGGAGAA 
GCGAAGATGG CCATCGGTGT GGTGAGAAAA CTTCTCGCGG CGGGCGATTT AGCGGGACCC 
GGGGACATCG GCGTCATCTC GCCGTACGCC GCGCAAGTTC GACGGTTGCA AGAAGAATAC 
GGCGTAGGAG GAAGTCCGAA ACGAAATTAC TTGGACTACA CCGAAGAGGA TAAAATAGAG 
GAGCTCGAAA TACGTTCCGT TGATGGATTC CAAGGCAGAG AAAAGGAAGT GATCGTTTTG 
TGCACCGTGC GAAGCAACCC GTCTGGAGAC ATCGGCTTCG TCGCCGACCC GCGCCGGCTC 
AACGTGGGAA TCACGCGAGC GAAACGTGGA TTGATCGTCC TCGGAAATCG CAAAACTTTG 
TCAAACAATG AGATGTGGCG AAGTTGGTTT AAGTGGATCG ACGAACAAAA CTGTGCGGTT 
TCCGACACTA CAAATTTCTA G

Protein sequence

MALKEVREPL NPSQRVAVKS ALSSSLAVWQ GPPGTGKTRT LIAYIGAAVH LASIQKRRGR 
GPIVLASAAS NVAVDNILEG LAKESFIVDG RPLRVVRVGA PAKVQPWLQQ LTLDAQIALH 
PLGRQAAAMR EAIRGQSGPA FARQRKQATQ LELTAAKSIL KSVDVVCTTC VGAGDELLED 
FTFPVAVVDE ATQCTEPGAL ISLTKALSAV LVGDSKQLPP TVVSRDAVDA GLQVSIFERM 
ERLGVKVSLL DMQYRMHPQI AEFPSLAFYK GKVGSVPTPQ DRPLVPGIAW PSPNVPVAFV 
EISAPESRAP DGNSLYNVGE AKMAIGVVRK LLAAGDLAGP GDIGVISPYA AQVRRLQEEY 
GVGGSPKRNY LDYTEEDKIE ELEIRSVDGF QGREKEVIVL CTVRSNPSGD IGFVADPRRL 
NVGITRAKRG LIVLGNRKTL SNNEMWRSWF KWIDEQNCAV SDTTNF