Gene OSTLU_37239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_37239
Symbol
ID	5001439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009358
Strand	-
Start bp	494969
End bp	496111
Gene Length	1143 bp
Protein Length	381 aa
Translation table
GC content	59%
IMG OID	640416860
Product	predicted protein
Protein accession	XP_001417523
Protein GI	145346081
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.00188315
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCCGC GCGGGCCCGC GCGGACGTCG CGCGCGCCCG TCGGTGCGCG CGTGGCGCGT 
CAGGGGCGCG TCTCGCGCGG TCGAACGCGA CGCGCGGCGC GCGAGGACGC GCTCGGCGGG 
CAAGATTTCA TCTACTCGCA ACGCAGCGGT GTCGAAGAAG AGCTCTTTAA AGGAAGCGTT 
CTCGGCGTCG ACGCGGACGT CGCGACGGGC GAACATCGCG AGCGTGAGTT TCGAACGTTC 
GCCGCGCTCG ATGGGTTTCA CGTGCCGGAA CGCTTCGCCG AGCGCGTGGC GACGCACGTG 
GTGAAGAACT TGTTGAAGGA TAAGGGGGCG CTCGGCGCGA CGTCTCCGGC GTTAATTTTG 
GGGATTTGGG GACACAAGGG TTGCGGCAAA ACGATGAACG TGGAGTTGGC GTGTAAGAAA 
ATGGGGTTGC AGCCGATCGT AACGAGCGCG GGGGAGTTGG AGGATTCGAC GGCGGGGGAG 
CCCGGGGCGA TGTTGCGGCG AAGGTATCTG ACCGCCGCGC GAGCGATGAG AGAGACGGGG 
AAGTTGAGTT GTCTTATTAT CAACGACATC GACGCCGGGA TCGGTAAGTT TAAGGACGAT 
CTGGGGACTG TAAATAATCA AATCACGCAC GGGACGTTGA TGAACATTTG TGACAATCCC 
ACGATCGTGA GCGAGGGACT GGTTTGGAGG ACGGACTCCA AATCTACCAA CGCGCGCGTG 
CCAATCATCG TCACGGGGAA TGATTTTTCT CGACTGTATG CGCCTCTAAC GAGAGACGGT 
CGAATGGATC TTTGGATGTG GGAGCCGACG TCGCAAGAGT TGGTTGAGAT GATACACGCT 
ATGATGAAGG ATGACGGGTT GACGACGGCG TGTTGCGAAA CGCTCGTCGC GACATTTCCG 
AATCAGCCTT TAGATTTCTT CGGCGCGTTA CGCGCGCGTG TGTATGATGA CGCCGTCAGT 
GATTTCGTGT TCAACGTCGG CTTAGATGGT TTAAATGACT CGCTCGTCGG TTTAGATGAA 
CGTCGGAGGT TGAAATTAGG CGACGTGACG ATCACGCTGG AGCGGCTGTT GGCGTGCGGA 
CGCAACGTCG TTGGCGAGCA AGAAAACGTG AATAATATTC AGCTCGCTCG AGAGTACATG 
CGT

Protein sequence

MAPRGPARTS RAPVGARVAR QGRVSRGRTR RAAREDALGG QDFIYSQRSG VEEELFKGSV 
LGVDADVATG EHREREFRTF AALDGFHVPE RFAERVATHV VKNLLKDKGA LGATSPALIL 
GIWGHKGCGK TMNVELACKK MGLQPIVTSA GELEDSTAGE PGAMLRRRYL TAARAMRETG 
KLSCLIINDI DAGIGKFKDD LGTVNNQITH GTLMNICDNP TIVSEGLVWR TDSKSTNARV 
PIIVTGNDFS RLYAPLTRDG RMDLWMWEPT SQELVEMIHA MMKDDGLTTA CCETLVATFP 
NQPLDFFGAL RARVYDDAVS DFVFNVGLDG LNDSLVGLDE RRRLKLGDVT ITLERLLACG 
RNVVGEQENV NNIQLAREYM R