Gene OSTLU_18002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_18002
Symbol
ID	5005396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	+
Start bp	112339
End bp	113685
Gene Length	1347 bp
Protein Length	448 aa
Translation table
GC content	56%
IMG OID	640420817
Product	predicted protein
Protein accession	XP_001421209
Protein GI	145353842
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0442] Prolyl-tRNA synthetase
TIGRFAM ID	[TIGR00408] prolyl-tRNA synthetase, family I

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	0.938893
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGATCC GGCCGTACGG GTACGCGATA TGGGAGGGGA TTCAAAAGTA TATGGATGCG 
AAGTTTAAGG CGACGGGGGT GCAGAACGCG TACTTTCCGC AGTTGATACC GTATTCGTTC 
ATAACGAAGG AGGCGTCGCA CGTGGAGGGT TTCGCGCCGG AGTTGGCGTT GGTGACGCGA 
GGGGGAGGGA AGGAGTTGGA GGAGCCGCTG GTGGTGCGAC CGACGAGTGA GACGATTGTG 
AATAATATGC TATCGCAGTG GATTCAGAGT TATCGGGATT TGCCGATGCT GTTGAATCAG 
TGGTGCAACG TGCACCGGTG GGAGATGCGC ACGCGGCCGT TCATTCGCAC GTTGGAGTTT 
CTTTGGCAAG AGGGTCACAC CGCGCACGCG ACGGCGGAGG AAGCGGAGGA GAGAGCTATG 
CAGATGATTC GTGTTTACGC CGAATTCGCC CAGACGCAGG CGGCGATGCC GGTGATTCCT 
GGGAGAAAGT CGCGCGTCGA ATCCTTCGCC GGGGCCAACG TGACGTACAC CATCGAGGCG 
ATGATGGGAG ATAAAAAGGC GCTTCAAGCG GGAACATCGC ACAATTTGGG CGATAACTTC 
GCCAAGGCGT TCGACACTAC GTTTTTAGAC GACAAGGGCG AGACGCAGTA CGTGCATCAG 
AGCTCTTGGG GGGTCTCTAC GCGCTTGATT GGCGGTATTC TCATGACGCA CGGCGACGAT 
TCCGGGTTAA TTTTGCCCCC GCGTTTGGCG CCGATTCAAG TCGTCGTGGT GCCAATTTGG 
AAGAAGGACG AAGAGAAGGA AGCGGTCATG GCATCTGTCG ATAGCATCAT TTCTTCTCTC 
TCCAACGCGG GCGTTCGAAC CCATCTTGAC GCGGATCAAA GTAAGTCGCC GGGGTGGAAA 
TTCAACCAGT ACGAAATGAA GGGCGTGCCG ATTCGCATTG AAGTCGGTCC GAAGGATGTC 
GCGAAGGGTG CGTGCGTCGT CGCTCGTCGC GATGTTCCGG GCAAGGAGGG TAAGGAGTTC 
GGCGTGAGTA TCGAGCCAGC CGCGCTCGAG ACCAAGGTCA ACGACGTGCT GAATGACATT 
CAAAACTCGA TGTTGCAAAA GGCGACCGAG TTTCGCGACG CCAACATCGT CGACGTTAAA 
ACTATGGACG AATTAAAGGC GACGATTGAG GCGGGGAAGT GGGCGCGATG CGGCTGGGAA 
GGTACCGACG AAGAAGAAAA AGCCATCAAG GAGGAGACCG GGGCAACGAT TCGGTGCTTC 
CCGTTCGATC AACCCGCGGG CGAGCACACG TGCTTGATGT CGGGTAAGCC GGCGAAGGAG 
GTGTGTATCT TTGCAAAATC GTACTAA

Protein sequence

MVIRPYGYAI WEGIQKYMDA KFKATGVQNA YFPQLIPYSF ITKEASHVEG FAPELALVTR 
GGGKELEEPL VVRPTSETIV NNMLSQWIQS YRDLPMLLNQ WCNVHRWEMR TRPFIRTLEF 
LWQEGHTAHA TAEEAEERAM QMIRVYAEFA QTQAAMPVIP GRKSRVESFA GANVTYTIEA 
MMGDKKALQA GTSHNLGDNF AKAFDTTFLD DKGETQYVHQ SSWGVSTRLI GGILMTHGDD 
SGLILPPRLA PIQVVVVPIW KKDEEKEAVM ASVDSIISSL SNAGVRTHLD ADQSKSPGWK 
FNQYEMKGVP IRIEVGPKDV AKGACVVARR DVPGKEGKEF GVSIEPAALE TKVNDVLNDI 
QNSMLQKATE FRDANIVDVK TMDELKATIE AGKWARCGWE GTDEEEKAIK EETGATIRCF 
PFDQPAGEHT CLMSGKPAKE VCIFAKSY