Gene OSTLU_24970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_24970
Symbol
ID	5003129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	+
Start bp	597613
End bp	599338
Gene Length	1726 bp
Protein Length	552 aa
Translation table
GC content	59%
IMG OID	640418550
Product	predicted protein
Protein accession	XP_001419214
Protein GI	145349594
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0280772
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.584273
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGATGG ATCTCAGAGG AGTGCCGATG ATGTTGTTAG ATCGCGAGAG CACGTTGTTG 
GCGAGGAAGC GATCGCTGGA TAACGTGATC GCGGCCGATG CTGGGAGGGA GAAGGATATG 
TGGCAGGTGC GAACGGATGA ACGCATGAAT GGATTGGGAA AGCAACCGAC GCTTGCTCCT 
CCGACGTCGT TGACGTGCCT GAAGTCGGGA TCGTGTTTGC CGATCGGTGG GTACAGCGTG 
GTCGCCACCG CGCCGCCGAT GTGGGGGCGC ACCGACGGGC CGCACGCGGG CAAGAGCGTG 
ATTTTAGTCA TCGCGCGATT GGACGCGAAC GGGTTGTTTA GAGACGCGAC GCCCGCGGTG 
AACGCGCGGA TGACTGGCCT CGTCGCGTTA ATGGCGGCCG CCAAGTCGAC GCAAAAGATG 
TTCAAGGAGA TGGACGCGGA AGACGTCGCC CATCCCGTGG CGTTTCTGGC GCTCAGTGGT 
GAAGATTTCG GTAAGCTCGG CTCTGAGCGA ATCGCGCGCG AGATGCTCGC CTCCACCGAA 
ACGTCGCAGC TTCCCGGTTT GGCTGGGAAG AAAATTCGCG CCATCATAGA ACTTGGTCCG 
CTCGGTTTCT CTGAATCCTT CGTGGGCGAA CGCGTGCCGA CGATTTACGT CCACGGCGCG 
CACGAGGGGA AAATGTTGGA GCGGATTGAG AAAATCGCGA ACACGTTTGA GTTTGAAGAG 
ACGGCGGCGT TGGGTGTACC CCGGATTCTT GAGACCGCGG CGCCGACATT CGAAGCGCTC 
CTCGCGAATG AGTACGAAAC GGCGTATTTA TCCGAGGATC CCGACGCTCC AATCGACGAG 
CTCAGTGGAA CGACGTTGGA CGCCGGTAGT TTTCGCGCCA TCGACGCCGA GCGCATGGAA 
ACTGTCGTGC ACGTCATCGC GCGTCTCGTG CGCGCCCTCG CGACGAACGA CAAAGTCGAC 
GCCCCGCGCT TGGATGTCGA GGGAGGTAAG CTCGCGGTGA AAGAGCTCGC AAAGTGTCTC 
ACGAATGAAA ACTACGGTTT GGAGAGATGC GAACTCGGCA AGAAGTTTTT GTACGGCGAA 
GAAGCGAGCG CGCCCGGACT CGGGGAATCT TTCGTCGACC CAGTCGCCTT GCCGTCTCGT 
TACCCCGATG CACTGCAAGG ACTCTCTCGC GATATGCAGT CGCACGAAGA CAAGAACGCC 
CTGGCAAGAT TCGTGTGGAA TTATCTCGCC GACGCCACGT CGAACACGGT TTCGCCCAAG 
ATGTGCGAAG GAGACGGTTC TTGCGCCGAA AACACCGTAT GCGTCGGCCG CACGCCGATG 
AGCGTCGGTG AGTGTCATGC TGCGACGTCG AAGTATATGT TAGCGCTTTC GACGCGATTA 
GCTTTTGATC GTTCGACGGG TCTTTGGATC GTGAACGAGC CCAAAGACCC GTTCGAGCGC 
GCGGCGCCGC TGTGGACGGA GAGCGACTGG TCGCCGGCGA TCGGTGCCAC GCTCGTCGCC 
CCGGTGAAGT ACAACTTCTT CACGAGCGTG GATGCTTTTC TTCTGTACGG TGTCATCTGC 
CTGATGCTCG TCGTGGCTGC GCAGTTTTGC TTCGATCGCG ACAAGAAACG CGGCGGCGCT 
CGCGAGCGCG AAGCGCTTTT GCGAGGCGCT CAACCGTGAC GCGCGGCGCG AACAGAAAAC 
GCGTGTAATA TTAGTAGTTG ACAATTAAAA CGACCACTGA AACGAA

Protein sequence

MGMDLRGVPM MLLDRESTLL ARKRSLDNVI AADAGREKDM WQVRTDERMN GLGKQPTLAP 
PTSLTCLKSG SCLPIGGYSV VATAPPMWGR TDGPHAGKSV ILVIARLDAN GLFRDATPAV 
NARMTGLVAL MAAAKSTQKM FKEMDAEDVA HPVAFLALSG EDFGKLGSER IAREMLASTE 
TSQLPGLAGK KIRAIIELGP LGFSESFVGE RVPTIYVHGA HEGKMLERIE KIANTFEFEE 
TAALGVPRIL ETAAPTFEAL LANEYETAYL SEDPDAPIDE LSGTTLDAGS FRAIDAERME 
TVVHVIARLV RALATNDKVD APRLDVEGGK LAVKELAKCL TNENYGLERC ELGKKFLYGE 
EASAPGLGES FVDPVALPSR YPDALQGLSR DMQSHEDKNA LARFVWNYLA DATSNTVSPK 
MCEGDGSCAE NTVCVGRTPM SVGECHAATS KYMLALSTRL AFDRSTGLWI VNEPKDPFER 
AAPLWTESDW SPAIGATLVA PVKYNFFTSV DAFLLYGVIC LMLVVAAQFC FDRDKKRGGA 
REREALLRGA QP