Gene OSTLU_18704 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_18704
Symbol
ID	5006289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009371
Strand	+
Start bp	209215
End bp	210294
Gene Length	1080 bp
Protein Length	359 aa
Translation table
GC content	60%
IMG OID	640421710
Product	predicted protein
Protein accession	XP_001422127
Protein GI	145355778
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0075] Serine-pyruvate aminotransferase/archaeal aspartate aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	58
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.018829
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCCGG TGTTCTGCGA GACGATGAAG AACATCGACG GGATGATGAA GCGGGCGTAC 
AACGCGAGCG GCGTGGTGAT CATGCCGGGA AGCGGGACGT ACGGGATGGA GGCGGTCGCG 
CGACAGTGGT GCAGCGGGAA AAAGGCGCTC GTGATTCGTA ATGGGTACTT TAGCTATCGA 
TGGACGGATA TTTTTGAGCA AACGCAAATC CCGAGCGAGA CGATCGTGAT GCGAGGACGC 
GCGGTGGACG ACGAAAAGAC GCCGGCGTTC GCGCCACCGC CCTTGGCGGA GGTCGTGGAG 
ATGATCAACA AGGAAAAACC CGCGGTGGTG TTCGCGCCGC ACGTGGAGAC GTCGACTGGG 
ATCATTCTGC CGGATTCGTA CATCAAGGCT GTGGCCGACG CCGTGCACGC GCACGGGGGG 
CTGTTCGTGC TCGATTCCAT CGCGAGCGGC ACGATTTGGG TGGACATGAA GGCGACCGGC 
GTGGACGCCA TCTTGAGCGC GCCGCAAAAG GGCTGGACTG GTCCGGCGTG CGCGAGCGTG 
ATCATGCTCG GCGAACGCGG CGTGCACGCG ACGCGCAACT CGCAATCCAC CTCCATGGTC 
ATCAACATGC GCAAGTGGCT CGAAGTCATG GATGCCTACT TGGCGGGCGG GTTCGCGTAC 
TACACCACCA TGCCCACCGA CGCGTTGACT TTGTTCGAAC GCGCGGCGAT GGCGACCGAA 
AAGGTTGGTT TCGACAAGGT CAAGCAAATG GCATGGGATC TCGGCACTGA GTGCCGCAAG 
ATGATGGCGA GCAAGGGATT GAAATCCGTC GCCGCCAAGG GGTTCGAGGC GCCGGGCGTC 
GTCGTGTCGT ACACGGATGA CGCCACCATG TTCGCCAAGT TCAAGTCTAA GGGTTTCCAA 
ATCGCCGCGG GCGTTCCGTT CATGATCAAC GAACCCGCCG GCAACAACAC TTTCCGCATC 
GGTTTGTTCG GCTTGGACAA AATCATGAAC AAGGACAACT GCATCAACAC CCTCGAGCCG 
ACGTTGGATG AAATTTTACG CGAAAACGCC GAAGCGGCCG GCGCCGAAGC CGCCTCTTAA

Protein sequence

MSPVFCETMK NIDGMMKRAY NASGVVIMPG SGTYGMEAVA RQWCSGKKAL VIRNGYFSYR 
WTDIFEQTQI PSETIVMRGR AVDDEKTPAF APPPLAEVVE MINKEKPAVV FAPHVETSTG 
IILPDSYIKA VADAVHAHGG LFVLDSIASG TIWVDMKATG VDAILSAPQK GWTGPACASV 
IMLGERGVHA TRNSQSTSMV INMRKWLEVM DAYLAGGFAY YTTMPTDALT LFERAAMATE 
KVGFDKVKQM AWDLGTECRK MMASKGLKSV AAKGFEAPGV VVSYTDDATM FAKFKSKGFQ 
IAAGVPFMIN EPAGNNTFRI GLFGLDKIMN KDNCINTLEP TLDEILRENA EAAGAEAAS