Gene OSTLU_29930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_29930
Symbol
ID	5000271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009356
Strand	+
Start bp	209414
End bp	210852
Gene Length	1439 bp
Protein Length	458 aa
Translation table
GC content	64%
IMG OID	640415692
Product	predicted protein
Protein accession	XP_001416103
Protein GI	145342038
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CCGCACACGC GCGCGCGCGA CGCTCGAAAC CGCGCCCGAA CGCCGAGAAC ACATCGCGCG 
CGATGCGCAC CGCGCGCGCG ACGTCGAAAC CGAGCGCGCG CGCGGCGCGA TCGACGACGA 
AGTCGACTCG AACGGCGACC GGGCGGACGC GCCCCGCGCG GTGTCCCGAC GCCGGCGACG 
CGCGTCGAGG CGCTCGAACG ATCCCGCGCG CGGGAAGCAC GTTTGGACGG ATATTCCGCG 
TCACCACGTT CGGGGAATCG CACGGTGGCG GCGTTGGGTG CGTCGTGGAT GGGGTGCCGC 
CGCGACTGCG CGTCACGCGC GAGGAGCTGC AGTTCGAGCT CGACCGGCGA CGCCCGGGAC 
AGAGCCGAAT CACGACCCCG CGAAACGAAG AGGACTCGTG CGAGATACTG AGCGGGGTCG 
GGCTCGATGG CGTCACGCTG GGCACGCCCG TGGCGGTGCT GGTGAGGAAT AAAGACCAGC 
GAAGCCAAGA CTACGGAGAA ATCGCGGTGG CGTATCGACC GTCGCACGCG GATGCGACGT 
ATGATATGAA ATACGGCGTC CGAGCGATCG CCGGTGGTGG ACGAAGCAGT GCTAGAGAAA 
CTATCGGACG CGTCGCGGCC GGTGCGATCG CGAAGAAGGT GCTCAAGGAG GTGGCGGGGA 
CGGAAATTTT GGCGTACGTG AGCGCGGTGC GCGACGTGAA AACCACCGCG GTGAACCACG 
AGACTATGAC GATGGATGAC GTTGAGTCAA ACATCGTGCG GTGCCCGGAC GAGAGTTGCG 
CGCAAAAGAT GATCGATGCG ATCGATGAGG TTCGGGTGAA GGGGGACTCG TGCGGGGGCG 
TGGTGACGTG CGTCGTGCGC AACCCACCGC GAGGCTTGGG TGCGCCCGCG TTCGACAAGC 
TCGAAGCCGA TTTGGCTAAG GCGATGTTGA GCTTACCGGC GACGAAAGGT TTCGAAATCG 
GTAGCGGTTT CGACGGCACG TTGCAAAAGG GTAGCGAGCA CAACGACGAG TTTTTCATGG 
ATAGCGAAAA GGGTTTGCGT ACGCGCACGA ACCGCTCCGG CGGTATCCAG GGTGGCATCT 
CCAACGGGGA GATGATCGAG ATGAAGATTG CGTTCAAACC GACGTCGACG ATCACACAGG 
CGCAAAATAC GGTGAACCGC GATGGGGTGG AGACGGAGCT CAAGGCTCGC GGTCGACACG 
ACCCGTGCGT GGTCCCGCGC GCGGTGCCGA TGGTGGAAGC CATGGTCGCG CTCACGCTCG 
TGGATCACTT GATGCTTCAG CACGCACAAT GCAACTTGAT CGACGCTGGA GATTTGACTG 
AGCTCGTTCA AGGAAACCTG CCCACTCTTT ACGACCCCGA AGCCATCGCC GCTGCGGCCG 
CGGCGTCCAA GGCGCAAATG ACCACGAAGG ACATGTCTGA CGCGTTCAGC GAAGATTAA

Protein sequence

MRTARATSKP SARAARSTTK STRTATGRTR PARCPDAGDA RRGARTIPRA GSTFGRIFRV 
TTFGESHGGG VGCVVDGVPP RLRVTREELQ FELDRRRPGQ SRITTPRNEE DSCEILSGVG 
LDGVTLGTPV AVLVRNKDQR SQDYGEIAVA YRPSHADATY DMKYGVRAIA GGGRSSARET 
IGRVAAGAIA KKVLKEVAGT EILAYVSAVR DVKTTAVNHE TMTMDDVESN IVRCPDESCA 
QKMIDAIDEV RVKGDSCGGV VTCVVRNPPR GLGAPAFDKL EADLAKAMLS LPATKGFEIG 
SGFDGTLQKG SEHNDEFFMD SEKGLRTRTN RSGGIQGGIS NGEMIEMKIA FKPTSTITQA 
QNTVNRDGVE TELKARGRHD PCVVPRAVPM VEAMVALTLV DHLMLQHAQC NLIDAGDLTE 
LVQGNLPTLY DPEAIAAAAA ASKAQMTTKD MSDAFSED