Gene OSTLU_94457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_94457
Symbol
ID	5002165
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009360
Strand	+
Start bp	213730
End bp	215070
Gene Length	1341 bp
Protein Length	386 aa
Translation table
GC content	54%
IMG OID	640417586
Product	predicted protein
Protein accession	XP_001418183
Protein GI	145347461
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAACG AGGACGGCGA TGTCGCCGCG GGGAGCCGGC CGAAGCGCAA GGCGAGCGCA 
TCGTTGCGAG CGCGGACGTC GCGAGGGAAA CAAGCGCCGT CGAGCGCGCA CTACGTGGGA 
TACGTGCAAG ACGACGAGAC GCCAGAGATG ATTATGAAAA AGTTTGAAGA GATGGAACGG 
ATTCGACAAG CCACCAAGGC GCAAGTCGGT GAGGATGGTG ATAAGGAGAA CAAGGAAGGC 
GCGACAAACG GTGCGGGTGG AGACGCGGTC GGGACCAACG GCGACGAGCA CGAAGGGTTG 
GACGAGGAAC AGTTGAAGGA GTTGTTCAAA AATACGTCTA CGTTTACGGT GAAGGAGGCC 
GTGATGGATT CTAACGCGCT TTTCGGTGAT ATGAGGATCG CGAACGAAGA TGGGATGTAT 
TTCTCGGACG ATGAAGAGTT GCAAGATGAA TTCTGGGAGG CGCTGACCGG TAAGAAGCGT 
AGAGGTAAGA AATCCAAGGG GCCGAGAGTG CCGAGAGCGC CGAGAGCGCC GCGCGAACCA 
AAGGCGGCGC AGTCACACAT GATCACCGCG TACAATAGCG ACCAAGGCTT GTTCTTGCGC 
AAGAAGAAGT TTGTTGATCC TTTCGAGCCT GTCATCATCA AGGTCCCGGC GCACCCGATT 
CCAGTGAGCT ATGGACGAGT AATTCAGCCG TACGAACCAA AATCGGTGCG AGAGGCGAAA 
CTGAAACAAG TTCCCGATTG CGTGCACATG CAAACGAACA TCAAGAAGAT GGAATATGAA 
TCGCTCGGTA AGGACTATTT AGGTGTGCTC ATGAACCCGC CGTGGGATAT TGAAGATTCC 
CCAGATCGCG GCGACGTGAC GTTGGAGGAC ATCGAAGCCA TTCCGCTTGA AAAACTCACG 
CCACTCGGTT TCATCTTTAT TTGGGTTGAG AAGGAAAATT TGTCCAAGGT TTGCGACATC 
ATGGACCGAA AGAACTTTGT CTACGTAGAG AACTTGACGT GGGTACAACT CAAGCCGAAC 
AACACGATCG TTGAGTCCTC TGCGCGCTAT CTTGGTCGCT CGCACAGAAC AATGCTCATC 
TTCAGACGAG ACGTTCGCGA CAAGCGCTTC ATTGAAGGGA AGAAGATTGA GTTGCGACAC 
CAACGTAACT CGGATGTGAC TCTCGATATT GTGCAGACCA CGAAAACTGG TCGACGTGTT 
GTCCCTGAGC ACGTGTACAA GTCCATCGAA ACTCTTTTAC CGACGGCGTA CGAACCTGGA 
ACGCCTGGTA AGCTCCTCGA ATTGTGGGCC GAACCGGGCG CGCGACGCGC GGGTTGGACT 
TCCGTGGCGG ATACTCCTTA G

Protein sequence

MANEDGDVAA GSRPKRKASA SLRARTSRGK QAPSSAHYVG YVQDDETPEM IMKKFEEMER 
IRQATKAQVG EDGDKENKEG ATNGAGGDAV GTNGDEHEGL DEEQLKELFK NTSTFTVKEA 
VMDSNALFGD MRIANEDGMY FSDDEELQDE FWEALTGKKR RVSYGRVIQP YEPKSVREAK 
LKQVPDCVHM QTNIKKMEYE SLGKDYLGVL MNPPWDIEDS PDRGDVTLED IEAIPLEKLT 
PLGFIFIWVE KENLSKVCDI MDRKNFVYVE NLTWVQLKPN NTIVESSARY LGRSHRTMLI 
FRRDVRDKRF IEGKKIELRH QRNSDVTLDI VQTTKTGRRV VPEHVYKSIE TLLPTAYEPG 
TPGKLLELWA EPGARRAGWT SVADTP