Gene OSTLU_3761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_3761
Symbol
ID	5003211
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	+
Start bp	600630
End bp	601649
Gene Length	1020 bp
Protein Length	340 aa
Translation table
GC content	60%
IMG OID	640418632
Product	predicted protein
Protein accession	XP_001419215
Protein GI	145349596
COG category	[J] Translation, ribosomal structure and biogenesis [K] Transcription [L] Replication, recombination and repair
COG ID	[COG0513] Superfamily II DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.695785
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.516627
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

AAGGATGTCG TCGCCGTCGC GAAGACGGGG AGCGGGAAGA CGTTGGCGTT TCTGTTGCCG 
ATGTTTCACG GTATGAAGCG ACACGGTGGC GTGGAGGGAC TCGTCGTCGC CCCGACGCGG 
GAATTGGCGA TACAGATTCA AGCCGAAGCG GAGAAGTTCG GCGCGGCGCA TGGGTTTCAA 
AGCGTCGTGG TGTACGGCGG CGCGAGCGCG TACGAGCAAA AGAACGCGTT GCGAACGAAA 
AAGCCGTGCC TCGTCATCGG CACGCCGGGG CGATTGACGG ACTTGATGAG TCAAGAGGGG 
GTGCTTTCGC TCGCCGAGCT TTCGGTGATC GTGCTGGATG AGGCGGATAG GATGTTAGAT 
ATGGGGTTTG AGCCGCAGAT TAAGCAAATC TTCGGCGCGA CGCCGACGAA GCGGCAGACG 
CTCTTGTTTT CGGCGACGTG GCCGAAATCC GTGCGTAAGC TCGCGGCGGG GTATTTAAAT 
CAAGATAAAT CGTGCGTCGA AGAGATTTTC ATCGGCGAAG GCGCGTCGGA CGGCGAACTG 
GCGGCGAACA AGGCTATCAC GCAACGCTTC ATCGAGGCGA GAGACCACGA AAAAGACGAG 
CACTTGTACA ATCTCATTTG CGAGTTTCCA GACGAGTCTC GCGTCGTCGT GTTCGCGAAT 
ACCAAGCGTC GCGTCGAAAA TCTGGCGAAA ACGTTCGCCG CGGAAGGTTT CGGCACCGTC 
TCCGTGCACG GCGATAAATC TCAAGCCGAC CGCGAGGCGT CTCTGCGCAA ATTCGTCGAA 
AACAAGGCGC CGCTCATGAT GGCCACCGAC GTCGCCGCGC GCGGTTTAGA CATCAAGGGC 
GTCACCCACG TCATCAATTA CGACATGGCG CGCGACGTTG AGAGTTACGT CCACAGAATC 
GGTCGAACCG GCCGCGCCGG CGAACTCGGC GCCGCCGTCA CGTTTTGGAA CGTCGATTAC 
GACAAGCCCT GCACCCCGGC GCTGTGCAAA ATCGCTCGAG ACGCCGGTCA GGCTGTCCCA

Protein sequence

KDVVAVAKTG SGKTLAFLLP MFHGMKRHGG VEGLVVAPTR ELAIQIQAEA EKFGAAHGFQ 
SVVVYGGASA YEQKNALRTK KPCLVIGTPG RLTDLMSQEG VLSLAELSVI VLDEADRMLD 
MGFEPQIKQI FGATPTKRQT LLFSATWPKS VRKLAAGYLN QDKSCVEEIF IGEGASDGEL 
AANKAITQRF IEARDHEKDE HLYNLICEFP DESRVVVFAN TKRRVENLAK TFAAEGFGTV 
SVHGDKSQAD REASLRKFVE NKAPLMMATD VAARGLDIKG VTHVINYDMA RDVESYVHRI 
GRTGRAGELG AAVTFWNVDY DKPCTPALCK IARDAGQAVP