Gene OSTLU_16898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_16898
Symbol
ID	5003516
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	-
Start bp	596195
End bp	597394
Gene Length	1200 bp
Protein Length	399 aa
Translation table
GC content	61%
IMG OID	640418937
Product	predicted protein
Protein accession	XP_001419849
Protein GI	145350937
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0312295
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.201381
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACGA AAGAGATCGA GGCGCGCGCG GTGCGATACA TGGGGATCGG GGACGATGGT 
AGTGGATGGA CGGCGGTGGA GGAAGATGGG AGCGGGGCTG GGGGGAGACG ACGAAGACAC 
GATTCGGATT CGGAAGAGGC GACGGCGGCG GCGGCGGCGG CGCCGAGTCG CCGCGCGAGA 
CACGATAGCG ATAGCGAAGA CGACGCCGGT GATGCTTCGG TACCGCCCGA GGATGCGCCA 
ACGACGAGCG CGGGCGATGG GCTGCAGTAC GATAGCGATG GGGACTTGAT TATTCCTCAG 
GAGCCCGCGG CGGCGGCGGC GGCGGCGGCG GCGGCGGGTG AGCCGCAATA CGACAGCGAT 
GGCGATTTTA TCCTGCCTGA AGAGCCTTCC GGGCAGCAAG AGCTGCAGTA CGATAGCGAC 
GGTGACTTGA TCTTACCGCC CGATCCCTTG CCGGAAGCGC CCGCGGAAGA TAATAAAAAG 
AAGTCGAAGG AAAAGAAGAC GAAGGAGCAC AAGATGACGG ATGGCACGTC CACCGGTCTC 
GTGAGCGCGG CGCAAGTCAT CATGGAAGCT GAGTTGAAGC GCAAAGCTGA GCAAGCGCGC 
GTGGCTAAGA TGACGGACGA GCAAAGTGGT CGCGGGGCGG CGACGAACTA CCGGGACAAG 
GCGACTGGGA AGCTCATGGA TAGCGAGGAG ATGAAGCGTC GCTCGGAGAA TGTCAAACCA 
AAGGAGCGCG AACGACCGGT TTGGGCAACG GGTGTGGAAC AGGCGAGACA AGCGAAGCAG 
TACGAGGTAG ATTTAGTCAA GGCAAAAGAC ACTCCGTTCG CGCACGCCGA CATCGATGCC 
GATTATGAAG ACAAACAGCG AAGTGCGATG CGTTTCGGCG ACCCGATGGC GCATTTGAGC 
CGCAAAAAGC GTCACGCTGA ATCGCTCAAT CTCCCATCCG TCGTCGACGG CTTAGGGTTG 
TCGATGGATG ATTTGAAAAA GTCTGGTTTC CGAATCCCGC AAGAGGTTCC ACCGCACAGC 
TGGCTTCGTC GCGGCGTCGT CGCGCCGCAC AACCGCTACG GCATCAAACC GGGCCGTCAC 
TGGGACGGCG TCGACCGCGG CACGGGCTTC GAGGCAAAAA TGTTCCGAAA GAAGAGCGAA 
TTGAAAGAGC GCGCGCAGCT CGAAGACGCG GACGCAGAGG AGCACAACGA ATGGTTTTAG

Protein sequence

MATKEIEARA VRYMGIGDDG SGWTAVEEDG SGAGGRRRRH DSDSEEATAA AAAAPSRRAR 
HDSDSEDDAG DASVPPEDAP TTSAGDGLQY DSDGDLIIPQ EPAAAAAAAA AAGEPQYDSD 
GDFILPEEPS GQQELQYDSD GDLILPPDPL PEAPAEDNKK KSKEKKTKEH KMTDGTSTGL 
VSAAQVIMEA ELKRKAEQAR VAKMTDEQSG RGAATNYRDK ATGKLMDSEE MKRRSENVKP 
KERERPVWAT GVEQARQAKQ YEVDLVKAKD TPFAHADIDA DYEDKQRSAM RFGDPMAHLS 
RKKRHAESLN LPSVVDGLGL SMDDLKKSGF RIPQEVPPHS WLRRGVVAPH NRYGIKPGRH 
WDGVDRGTGF EAKMFRKKSE LKERAQLEDA DAEEHNEWF