Gene OSTLU_89032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_89032
Symbol
ID	5004935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009367
Strand	-
Start bp	487155
End bp	489206
Gene Length	2052 bp
Protein Length	683 aa
Translation table
GC content	63%
IMG OID	640420356
Product	predicted protein
Protein accession	XP_001421164
Protein GI	145353743
COG category
COG ID
TIGRFAM ID	[TIGR00756] pentatricopeptide repeat domain (PPR motif)

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	0.356102
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCGCGG AGCGCGACGC GCGCGCGCGC GCGTCGAACG CGGCGCGCGG GGAGGCGCAA 
TCGCGCGATG AAGACGCGCG CGCGTCGACG TCGGCGGATG CCGAAGCGGC GCGGGCGGCG 
TCGCTGCGCC CGGCGACGCG GGCGAACGTT CGACGGGAGA TCATGACGAT GAACGACGGC 
ACCGAACGCG AGATCACGGT GGACGCGCGG TTTAAGTGCG CGAAGTGCGC GCGCGGGAGC 
TCGTGCTTCG CCGTGCACCG AGCGACGAGC GCGGTGAGCG GGATGCGAGC GAAACGGCGG 
TATAACGAAC GGAAAAAGGC GAAAAAGACG AAGAGTAAAT ACGCGTCGGA CGTCGAGGGC 
GGCGGGCGAG GGTCGAGGGC GCGCGCGGAC GCGGATCCGG TCGGGGCGAC GCTGGCGCTG 
ATACGAGACG GACACAGGCC GACGGCGAAG ACGTTTACGG CGGTGATTAG CACGCTAGGC 
GCGATGGGAC GCGCGAAAGA GGCTTTGGAC GATGTGTTGC CGATGATCGA GGAGTATGGC 
GATGACGTCG ATGTGGCGGT GTGGAACGCC GTGGCGCACG CGTTTTGCGC CGGCGGAGAC 
CCGGCGGGGG CGGAGAAAAT CGTGGATAGA ATGGTCGGCG AAGACGGCGT GGGCGTGAAC 
GGGGCGACGC ATCCGGAGAT CATATACACG TACGCGAAGC GTGGAGAGGC AAATAGAGTG 
TATAGGTTGA TCAGACGAAT GTCGAGCGAG CATGGAATAA TCCCAGACGA ACGCGCGTAT 
AACGCGTTTT TGCGAGGCTT GTGCGAGCGG GACGATCTCG AGGACGCCGA GGAAGTGCTC 
AGACGATGGA ACAACGAAAA GTTCGACTTG GAGCGACAGA GTGACCGCGG TGGGCGAGTG 
TCGAAGCCGA GCGCGGCGTC ATACGGGTTA CTCATCGACG CGTGGACGCG TCGCGGAAAC 
ATGCTCGCCG CGCGCAAGCT TTTACAACAG ATGCAATGGG AGCGCATCGC GCCCTCACTG 
CCGCTGTTTA ACATGCTCAT AGACGGATAC CTCAAGCAAG AAAACATGCG CGCTGCGGAA 
GGGCTGTTTC GCGAGCTCGA ATCGAGTGGA ACGTGGGATA TGGAGTCGTT GGGGATCAAA 
CCAGACAACG TGACGTACAC GTTGTTTTTA GATTATTGGG CGAATCAAGG CCAAGTCGAC 
GCGTGCGAGC GAATCTTCAA TCGCATGCAT CGCAAGGAAG TCGCGCCAGA CGTCACAGCT 
TACGGGACGT TGGTAAAGGC GTACGCGCGC GCGCGCGATT CCGACGGCGC TGAGGCGGTT 
TTGGATCGAC TCGCCGAGGC AAAGGTGGCT CCGTCGGTGG CTATTTACAG CGCCGTCGTC 
GCCGCACATT GTACGATTGG TAACATGTCG CGCGCGCGCG ACGTACTCGA GCGCATGTTC 
GACGCGGGCT TGCGCCCGAA CGAGCGTACG TTCGCTCATT TCGCGTGGGG ATACGGCCAA 
CTGGAAGACA TCAACGGTAT TGCCGAGGTG GCGAAGTTAA TGCTCGCGAG CGGGCTCAAA 
CTCAAGGGTG CGAACCGCAC CGCCATCGTG CGCGCGTGCG AAGAGTGCGG AATGAGCATG 
AGCGCCGTAC AAGCGCTGCT GGATCGAATC AATCCCGAAA TGACGCAGCG CAAGGGCGTG 
TGGAAACGAG ACGGCGGCGA GCCGAAACCC AAATCCAATC GAGCCGCCGC CGCCGCCGCC 
GACGAGGACC TCGAACCGTC AACGCTCGAA CCGACGAAGA CGAAAGAAAT CTACGGAGGT 
CCGGAGTCCA CCGCGCGTCG GGTGTCGCTT TCCCAGCGTG TAGAGTCCCT CGACGAAGAC 
GACGACGACG GCGATACGGG CGCCGTGGAC GCGCCGCCGG CGAGCTCGGA TTGGCCTCGC 
AAAGTCTCCA CTCGCGCCGT CGCCATCGCG CACCGCGCGT CCTCGCGCGC GCGCCCTATC 
CGTCGCACAT TTACACGAAC GAACGCGCGC GCGTTCGCGA TCACGCGAGC CCTCGGCGCT 
GCTTCGATGT AA

Protein sequence

VRAERDARAR ASNAARGEAQ SRDEDARAST SADAEAARAA SLRPATRANV RREIMTMNDG 
TEREITVDAR FKCAKCARGS SCFAVHRATS AVSGMRAKRR YNERKKAKKT KSKYASDVEG 
GGRGSRARAD ADPVGATLAL IRDGHRPTAK TFTAVISTLG AMGRAKEALD DVLPMIEEYG 
DDVDVAVWNA VAHAFCAGGD PAGAEKIVDR MVGEDGVGVN GATHPEIIYT YAKRGEANRV 
YRLIRRMSSE HGIIPDERAY NAFLRGLCER DDLEDAEEVL RRWNNEKFDL ERQSDRGGRV 
SKPSAASYGL LIDAWTRRGN MLAARKLLQQ MQWERIAPSL PLFNMLIDGY LKQENMRAAE 
GLFRELESSG TWDMESLGIK PDNVTYTLFL DYWANQGQVD ACERIFNRMH RKEVAPDVTA 
YGTLVKAYAR ARDSDGAEAV LDRLAEAKVA PSVAIYSAVV AAHCTIGNMS RARDVLERMF 
DAGLRPNERT FAHFAWGYGQ LEDINGIAEV AKLMLASGLK LKGANRTAIV RACEECGMSM 
SAVQALLDRI NPEMTQRKGV WKRDGGEPKP KSNRAAAAAA DEDLEPSTLE PTKTKEIYGG 
PESTARRVSL SQRVESLDED DDDGDTGAVD APPASSDWPR KVSTRAVAIA HRASSRARPI 
RRTFTRTNAR AFAITRALGA ASM