Gene OSTLU_3562 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_3562
Symbol
ID	5000677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	+
Start bp	107340
End bp	108326
Gene Length	987 bp
Protein Length	329 aa
Translation table
GC content	62%
IMG OID	640416098
Product	predicted protein
Protein accession	XP_001416558
Protein GI	145344062
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GAGCGCGAGA CGGTGCGATT GTTTAATAAC GCCAAGGCGA GCGTCGTGTA CATCACCAAT 
GTCGCCGTGC GCAGAGATGC GTTCACGTTG AATCTCACGG AACAGCCGCA AGGGGCGGGG 
AGCGGCATCG TCTGGGACGA CAAGGGGCAC ATCGTCACCA ACTACCACGT CATCGACAAG 
GCGAATCAGT TGAAGGTGTC GTTTTTGCCG AATAAAGGCG GGGTGCAGAA TCAGAAGACG 
TACGACGCCG CAATCGTTGG GTTCGACGAC GATAAGGACA TCGCCGTGCT GCAGGTGAAC 
GACCCAGAGG CGCTGCGGGA GATGAAACCG CTCGTCATCG GAACGAGCGG AGACTCCATG 
GTGGGCCAGC GTGTCTTCGC GATCGGGAAC CCGTTTGGGC TCGATCACAC GCTCACAACC 
GGCATCATCA GCGGCCTCGG ACGAGAGATT CAAAGCGGTA ACACCGGGCG CCCAATCGAC 
GGCATCATTC AAACGGACGC GGCGATCAAT CCCGGCAACT CGGGGGGCCC TTTGTTGAAT 
TCGTCGGGAC AGCTCATCGG CATCAACACC GCGATTTATT CCGCGTCCGG GACGTCCAGC 
GGCGTGGGAT TCGCCCTCCC GAGCGACATG GTGAGCGGTA TCGTCGATCA AATCATTCGT 
TACGGTCGCG TGACGCGTCC GATTCTCGGC GTCTCCTTCG CCCCCGACGG CGCGCTCGAC 
CAGCTCGGCC TCGGCGGCGT GTTGGTGCTC GACGCTCGCG CGGGCGGTCC CGCCGCGCGC 
GCCGGCGTCC GCAGCACCAC GCGCGACGAA TCCGGCCGTC TCATCCTCGG CGACATCATC 
ATCGAGCTCG CGGGCGAGCA AATTCAAGAC TCCAGCGATT TATACCGCAC CCTCGACAAG 
CTCTCCGTCG GCGAAACCGT CGACGTGACG CTCTTGCGAG GCGTCGACAA AGTCTCCGCC 
CGCGTCACCC TCGACGACGT CAAGGAC

Protein sequence

ERETVRLFNN AKASVVYITN VAVRRDAFTL NLTEQPQGAG SGIVWDDKGH IVTNYHVIDK 
ANQLKVSFLP NKGGVQNQKT YDAAIVGFDD DKDIAVLQVN DPEALREMKP LVIGTSGDSM 
VGQRVFAIGN PFGLDHTLTT GIISGLGREI QSGNTGRPID GIIQTDAAIN PGNSGGPLLN 
SSGQLIGINT AIYSASGTSS GVGFALPSDM VSGIVDQIIR YGRVTRPILG VSFAPDGALD 
QLGLGGVLVL DARAGGPAAR AGVRSTTRDE SGRLILGDII IELAGEQIQD SSDLYRTLDK 
LSVGETVDVT LLRGVDKVSA RVTLDDVKD