Gene OSTLU_32688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_32688
Symbol
ID	5002734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009361
Strand	-
Start bp	482691
End bp	484172
Gene Length	1482 bp
Protein Length	417 aa
Translation table
GC content	65%
IMG OID	640418155
Product	predicted protein
Protein accession	XP_001418947
Protein GI	145349037
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0289228
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0344017
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGGCACACGA CGGCGCGGCG CGCGACGACG CGGACGCGGT GAACGACGGG CGTCAGACGC 
GAGACGAAGA CGACGCGCGG GTGACGCGCG ACGCGCGAAC GGACGGGCGC GATGGCGACG 
GCGCGAACGA TGGGCGCGGC GGTGACGACG ACGACGACGG GGGGGCGTCG CGAGGCGACG 
CGCGCGACGG GCGCGGCGAC GCGAGGCGCG CGCGTCGTGC GACGCGTGAT GACGCCGCCG 
ACGCAGGGGA AGATCTCGGA GCAGTCGCGA CCGGACGCGA ACGGGAGGTA CGGCGCGTAC 
GGGGGGAAGT ACGTGCCGGA GACGCTGATC CCGGCGCTGC GGGCGCTGGA GAAGGAGTAC 
GAGGCGATCA AGACGGACCC GGCGTTCCAG GCGGAGCTGA AGGATATTCT GAAGGATTAC 
GTCGGACGCG AGAATCCGCT GTACTACGCC GAAAGGTTGA GCGAACACTT CAAGGACGCG 
AACGGGGAAG GGCCGGACGT GTACCTGAAG CGCGAAGACC TGAACCACAC GGGGGCGCAC 
AAGATCAACA ACGCGGTCGG GCAAGCGCTG TTGGCGAAGC GAATGGGGAA GAAGCGCATC 
ATCGCTGAGA CCGGGGCGGG ACAACACGGC GTGGCGACGG CGACGGTGTG CGCGCGATTC 
GGGTTGGAGT GTATCATTTA CATGGGCGCG GCGGATATGG AGCGACAAAA GCTCAACGTG 
TTCCGCATGC GTTTGCTCGG CGCCACGGTT CGACCGGTGC GCGCGGGCAC GGCCACGCTC 
AAGGATGCGA CGTCTGAGGC TATTCGTGAC TGGGTGACGA ACGTTGAGGA CACGCACTAC 
ATCCTCGGCT CGGTCGCGGG CCCGCACCCG TATCCGATGA TGGTGCGCGA CTTCCACGCC 
GTCATCGGTC AAGAGACTAG AAGACAAGCC ATGGAGAAAT GGGGCGGTTT GCCGGACATC 
CTCGTCGCGT GCGTTGGCGG TGGCTCCAAC GCCATGGGTC TGTTCCACGA GTTCATCGAC 
GACGAATCCG TGCGCATCAT CGGCGTCGAA GCCGGCGGCG AAGGCATCGA GCCGGGCCAA 
AAGCACGCCG CGACGCTCAC CTTGGGCACC CCGGGCGTGC TTCACGGCTC GTTCTCGTAC 
TTGATTCAAG ATGAAGAGGG TCAAATCGTT GAGCCGCACT CCATCTCCGC CGGTCTCGAT 
TACCCGGGCA TCGGTCCGGA GCACGCCTTC TTGAAGGATT TCGGTCGCGC CGAGTACCAC 
GCCATCACCG ACAAGGAAGC GCTCGACGCT TTCGTCGCCA CCTCTCGTCT CGAGGGTATC 
ATCCCTGCCC TTGAAACGTC CCACGCCTTG GCGTACTTGT GGAAGCTCTG CCCTGGTCTC 
CCCAACGGCA CCAAGGTTGT CCTCAACTGC AGCGGCCGCG GCGACAAGGA CGTCAACACC 
GCCGCCAAGT TTTTGGACAT CAGCGGTGAG GTCGACGGGT GA

Protein sequence

MTPPTQGKIS EQSRPDANGR YGAYGGKYVP ETLIPALRAL EKEYEAIKTD PAFQAELKDI 
LKDYVGRENP LYYAERLSEH FKDANGEGPD VYLKREDLNH TGAHKINNAV GQALLAKRMG 
KKRIIAETGA GQHGVATATV CARFGLECII YMGAADMERQ KLNVFRMRLL GATVRPVRAG 
TATLKDATSE AIRDWVTNVE DTHYILGSVA GPHPYPMMVR DFHAVIGQET RRQAMEKWGG 
LPDILVACVG GGSNAMGLFH EFIDDESVRI IGVEAGGEGI EPGQKHAATL TLGTPGVLHG 
SFSYLIQDEE GQIVEPHSIS AGLDYPGIGP EHAFLKDFGR AEYHAITDKE ALDAFVATSR 
LEGIIPALET SHALAYLWKL CPGLPNGTKV VLNCSGRGDK DVNTAAKFLD ISGEVDG