Gene OSTLU_25015 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_25015
Symbol
ID	5003724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	-
Start bp	141440
End bp	142650
Gene Length	1211 bp
Protein Length	394 aa
Translation table
GC content	63%
IMG OID	640419145
Product	predicted protein
Protein accession	XP_001419723
Protein GI	145350671
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0269626
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGGACG CCCCGCTGTT GACGCGCGAC GGCGACGGGG ATCGACGACA CCGCTCGTCG 
CGCGCGCGCG CGTCCACGTC GGTGTTTCGA CCGACGTTCG CGCTGGGCGT GACGCTCGCG 
TGCGCGTGCG CGCTGGCGAA GACGAATGGT GTTGGACGAA CGATCGCGCG CGACTGGATG 
TCTGGAGACG ACGCGCGCGA ACGCGCGAGC GCGAATGAAC GAGGGAAAAT GAGCGCGTTC 
GGGAGCGCGG CCGCGTTGGC GACGAGCGGA GACGGGACGA CGCCGTTCGC GGTGGTGAGC 
GACCCGTTCG TCACGGGCGG CGGCGACGAC GACGGAGCGA GCGAGGAGTA TTCTTTAGTG 
CGGAAATCGC AAATGTCGTC GAGTGGAGAC ATAGAGGTGA ATCACAGAGA AGATGTCGAG 
ATGATACCAC GCGCGGCGGC GACGATGGTG CACTTGACGT TGCTCACGGC GTGCGCGCAA 
CTCGGGTCGT TGACGTTTGC GCCGGGAGCG TGGGAGGACG TCGTCGGCGC TCGGGTGACG 
ACAAAGTCGA TGTCGAACGA CTTTTTATTC TCCCAAGCGC AGGAAATGAC GCAAACAAGG 
TGTGGAACGT TTGAAGTGGA CGTCATGCTC GGTGCAGGGG AGCAGTTTGG ATTTTATTTG 
TACCCGCTCG ACAACACGAG CGACGAGGCG ACGGTGTCCG ACATCGGTTG CTTGCACAGG 
GGGGGCGGGC GATGTCCGAA ATTTGCGACT CCATCGGCTC TCGAAGGCAT GGAGGTTTGT 
ACCTCTGTCA TCGAGGAGGG CGATGACATC TTTTACAACC GCGTATTCGA TGGGAAGACG 
TTCACGTACG TCTACGGTTC GTGCGACGAG GGATGCGCGC TGAAAGCGCC GAGCGGGTGT 
CCGGCGTCCC ACATGCCCGA AGTCACCACT TTAGACACCG GAGTGTGCAC CGATCCCGCA 
CACGCCGGTA TTTACAACGC CCTGTGCGCG CAGAGCTGCG GTGCGGGCAC CACGGACTGC 
GACGCGTCGT GTCGAGCGGC GTCCGACGCC GGCGTCTCCC TCTCGTGCGT TCCCGGCGCG 
CGCGGCGCCG ACGCGTGTCG ATGCGCCCAC GTCGCCGCCA ACGCGACGAC CGAGTGCACC 
GTTCCCGGAT ACGACTGCTG CACGTGCGAG AGCATCATCG TGTGATCACA TTCATAGACC 
CGTAGTTCCT T

Protein sequence

MEDAPLLTRD GDGDRRHRSS RARASTSVFR PTFALGVTLA CACALAKTNG VGRTIARDWM 
SGDDARERAS ANERGKMSAF GSAAALATSG DGTTPFAVVS DPFVTGGGDD DGASEEYSLV 
RKSQMSSSGD IEVNHREDVE MIPRAAATMV HLTLLTACAQ LGSLTFAPGA WEDVVGARVT 
TKSMSNDFLF SQAQEMTQTR CGTFEVDVML GAGEQFGFYL YPLDNTSDEA TVSDIGCLHR 
GGGRCPKFAT PSALEGMEVC TSVIEEGDDI FYNRVFDGKT FTYVYGSCDE GCALKAPSGC 
PASHMPEVTT LDTGVCTDPA HAGIYNALCA QSCGAGTTDC DASCRAASDA GVSLSCVPGA 
RGADACRCAH VAANATTECT VPGYDCCTCE SIIV