Gene OSTLU_1531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_1531
Symbol
ID	5004503
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009365
Strand	+
Start bp	583157
End bp	584497
Gene Length	1341 bp
Protein Length	447 aa
Translation table
GC content	58%
IMG OID	640419924
Product	predicted protein
Protein accession	XP_001420388
Protein GI	145352083
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.486556
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TACGTGCACG AGCTGCGCTA CGTCGATTTG AGCGATAATT TGTTCACGGG AGATTTGCCG 
CGAGACTTGT TTAAGATGAC GCAGCTTCAG AGCCTCGTGT TGTCTGGAAA TCGCATCACG 
GGCGCGCTTC CCGAGGACGT CGGCGCGCTG ACGAATCTGC GGCACATCGA CTTGTCCGCG 
AACGCCATGC GCGGCGCGCT TCCCGAGTCG CTCGGCGCGT TGAGTGAGCT CAAAGTGCTG 
TATCTGGGCG AGTCTGGGCT CGAGAACAAA AACGACTTCG CGGGCCCGAT TCCCGAGTCG 
TGGCGACGTT TGAAATCGCT GAAATCGTTT TCGTTAGCCG GCAACTCGAA CATCGGTGGA 
ACGTTGCCCG ATTGGTTGCT CAACAATCTG GACTCGCTCG AAGAGTTGAC GCTGTCGAGA 
TGCGGTTTGA CTGGGGAAAT ACCGCCGAAC GTCGATCAAA TGAAGTCGCT TCGCGTGTTG 
GATCTCGGCG AAAACTCATT CAGCGGCGTC GTGCCCGTGG AATCGCTGTC GAGATTGCGA 
CGTTTGAAGC ACCTGCGTTT GGCCGGAAAC GCGCTCATCG GGTCGCTCGG CCCATCCGTC 
GCCCATTTGC GAGAGATTGA AACCTTTGAC GTGAGCTCGA ACCGTTTGAC GGGGGATTTG 
CCAAAGGAAC TCTTCTCGCT GCGATTGCTA GAAATTTTGG ACGTTTCAAA CAACGCGTTT 
ACCGGGACGT TGGCTCCTCC CGACGGCGCG GAGACGTCGA ATTTGCGCGT CGTCGACGCC 
GAAAGCAACC GTCTCGTCGG CGTGCTCTTA GACGGCGAGT TCTTCAAGCG CGCGCCGCAT 
TTGAGGTATT TGAGACTGTC GAATAACAGA ATTTCCGGCG CGTTCACCGA CGGCGCGTTC 
GACGACGCGG GCGAACTGGT GGAGCTACAC GCGTCGAATA ACGATTTGCT CGGCCCGTTG 
CCGGATTCTG TCCGTCATTT GACAAAGTTG AAATCGTTGC GACTGAGCGG CAACGCGCGT 
CTGGGCGCCG GTCGTGGAAT GCCCGACGCG CTGTCGGAGT GTTGGAATCT CAGAGTCGTC 
GAGCTCGCGC GCGCGGGCTT CGAGGGCGAC ATCGCGGACG ATGCGTTCGC GCGCATGCGT 
CGATTATCTT CGCTGAATTT GGCCGAAAAC AAGTTTTCGG GCAACGTGCC CGCGTCGTTG 
AAATCGGCTG AATTTCTGCG GAAATTGGAG ATTCAAAACA ACGCATTCGT CGGGGAAATT 
CCGTCGTGGC TCGTCGAGCT TCCGCACCTG GAACTCGCCG ATTTCACGGG CAACAAGTTC 
ACGGGCGCGA TCCCGGATTC G

Protein sequence

YVHELRYVDL SDNLFTGDLP RDLFKMTQLQ SLVLSGNRIT GALPEDVGAL TNLRHIDLSA 
NAMRGALPES LGALSELKVL YLGESGLENK NDFAGPIPES WRRLKSLKSF SLAGNSNIGG 
TLPDWLLNNL DSLEELTLSR CGLTGEIPPN VDQMKSLRVL DLGENSFSGV VPVESLSRLR 
RLKHLRLAGN ALIGSLGPSV AHLREIETFD VSSNRLTGDL PKELFSLRLL EILDVSNNAF 
TGTLAPPDGA ETSNLRVVDA ESNRLVGVLL DGEFFKRAPH LRYLRLSNNR ISGAFTDGAF 
DDAGELVELH ASNNDLLGPL PDSVRHLTKL KSLRLSGNAR LGAGRGMPDA LSECWNLRVV 
ELARAGFEGD IADDAFARMR RLSSLNLAEN KFSGNVPASL KSAEFLRKLE IQNNAFVGEI 
PSWLVELPHL ELADFTGNKF TGAIPDS