Gene OSTLU_93558 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_93558
Symbol
ID	5004711
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009366
Strand	+
Start bp	441193
End bp	442293
Gene Length	1101 bp
Protein Length	366 aa
Translation table
GC content	66%
IMG OID	640420132
Product	predicted protein
Protein accession	XP_001420692
Protein GI	145352733
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.00340176
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCGA GGCTCCTTCT CTGCGCCGTC TTATTCGCCT TCGTCCCTCG ATCGCGCGCC 
GTCGACGTCG TTCGCGCGAA CGATCGCGCG CCGTCGAATC CGATATTCCC CAACGGCCTG 
GACGTCTTCG GCAGGGACGC GCGGTGCCGC GCGTGTCACG CCCTGGTGAA CGCGCTCAAT 
GAAAATCTCA TCCCATCCAT CGCCGCCGAG CGCGCGAAAC CGGCGTCTCG AGCGACGTAC 
GGCGCGCTGG ACGCCCTCAT CGAGGCCGCG CTGGCGCCGG CGTGCCGATT GAGCGCGACC 
TGGCGCGACG CGACGACGAG GAAGGCGTGC GAGAGGCTGA TGGAGACGCG AGAGGACGAC 
GTCGCGGCGG CGTATCATCG ATGGATCAAA CGCGGCGGCG GATCGGCGCG GGACGGCGGT 
GGGACGCGCG GAGACGGGTC GAGGGTGACG GTGGCGGAGG CGAGATCGGG GGCGTACGAT 
CCGGTGGGAT GGAATTGGAA TTACGAGGTG TGCGGACGCG CGACGGGCGC GTGCAGGGAA 
CAGTTGGCGA TGCACGAACT CGCGGAGTTT GACGACGACG GCGCGGGCGA CGGAGAGGCG 
AGGAAGTATC GATCGGAGCA GAGACCGGCG GACGGGGAGA CGGTGGATGG GATGCTGAAG 
GTGACGGCGG GAACGTTTCA CGAGGCGGTG GTGCGCCGAG ACGCGGACGT CGTGGCGTAC 
GTGGGATTTC CAAAGTTGGA CAAGTGGGGG CACTTTTACG CGGCGGCCGC GTTGGGGAGC 
GTGCGCGAGA TGTTCGCGTC GAACGAGACC GCGCGCGAGG GGTTTGAGAT CGCGTTCGTG 
GATGGCACGC ACAACGACGT GCCGCCGCCG TACGGGAGCG ACGCGCAGGC GCCGACGGTG 
GCGATGTTCG CGGCGGGGAA TAAAAATTGG CCTCGGTACA TGACGGACAT GAACGACGGG 
AAGTTGACCG CGTTTGAAGT CTTACAATTC ATCATGCGCA CGTCGGCGAA GCCGTCGACG 
GTGCAACACG CGCATTGGCT CACGCAGTCG CTTTCGCAAA ACGCGCTTCA TCGTAGAATT 
TGGGACGACG ACGAGTTGTG A

Protein sequence

MSSRLLLCAV LFAFVPRSRA VDVVRANDRA PSNPIFPNGL DVFGRDARCR ACHALVNALN 
ENLIPSIAAE RAKPASRATY GALDALIEAA LAPACRLSAT WRDATTRKAC ERLMETREDD 
VAAAYHRWIK RGGGSARDGG GTRGDGSRVT VAEARSGAYD PVGWNWNYEV CGRATGACRE 
QLAMHELAEF DDDGAGDGEA RKYRSEQRPA DGETVDGMLK VTAGTFHEAV VRRDADVVAY 
VGFPKLDKWG HFYAAAALGS VREMFASNET AREGFEIAFV DGTHNDVPPP YGSDAQAPTV 
AMFAAGNKNW PRYMTDMNDG KLTAFEVLQF IMRTSAKPST VQHAHWLTQS LSQNALHRRI 
WDDDEL