Gene OSTLU_18368 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_18368
Symbol
ID	5005730
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009369
Strand	-
Start bp	283463
End bp	284785
Gene Length	1323 bp
Protein Length	419 aa
Translation table
GC content	62%
IMG OID	640421151
Product	predicted protein
Protein accession	XP_001421765
Protein GI	145355010
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.370386
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.858147
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAAAC GACGCACCGC GCTCGTGGTT TTGGGCGACT TTGGTCGTTC GCCTCGAATG 
CAATACCACG CGCTGTCGCT CGCGCGCGAC GCGGATCGCG CCGTCGACGT CGTGTGTTAC 
TCGGGCACGC CTCCGATCGA TGCGCTGTCT CGCGAAGACG CGGTGACGAT GCGTTACGTC 
GTGGGATGTC GGTGGCGGTG GTTGACGCGC GTCCCGCTCG CGCTCGCGCT CGGGACGCGC 
GTCGCGGCGC AGTGCGCGCA CTTGTTTTGG ATCCTGATGA CGATGCAGCG GTGCGAAGAG 
ATGCTGATAC AGAACCCGCC GTGCGTGCCG ACGTTTTTGG TGTGCGGAAT CGTGTGTCGC 
GCGCGACGGA CGCGGTTGGT GGTGGACTGG CATAATTTCG CGTACACGCT GTTCGGGATG 
AAGCGCGGCG ACGCGAGCGC GACGACGCGA ATGTTGAAAT GGTACGAACG GACGCAGGGA 
AAGATGTGGG GAGACGCGCA CGTGTGCGTG ACGAAGGCGA TGGGAAACTT TTTGGAGAAA 
GAATGGAAGA TTGAGGGCGC GCGCGTCGTG GAAGACCGCG CGGCGGAGCG ATTTCGAGAG 
GCGGCGCGCG AGGCGACGAC GCCGTTGGAA TTTTGGAGAA GCGAACCCGC GCGCTCGGCG 
CTGGAGGCTT CGCCCGTCGC GCGGAGTGAG GACGCGCTCG ATCGGTTTTT GCGGGGCACG 
CACGAGAATA TGACGAAGAA TAAGCCGAGG TTCATCGTGA GTTCGACGTC GTGGACGCCG 
GATGAAGACT TTGGCGTTTT GCTTGACGCC GCCGTCGCGT ACGACGCGCG CAAGCGCGCG 
AAGGGCGATC ATGCGTCAAA GTCGTACCCT GACATCGTCA TAATTATCAC CGGTCAAGGC 
CCACGAAAGA CGATGTACGA GAAGAAGATT AACGAACTCG CGCTCGAGCA CGTGGCGTTT 
CGAACCGTCT GGCTCGACGC CGCTGACTAT CCGCGCGCGC TCGCGAACGC GCACCTGGGC 
GTCTCCCTGC ACACCTCGAG CAGCGGTTTA GATTTACCGA TGAAAATTGT GGATATGTTT 
GGGGCATCGT TACCCGTCGC CGCGATGCGG TACGCTGTCA TCGGAGAGCT CGTGCAAGAG 
GGCGTCAACG GCGTGCTCTT TGCCGACGCC ACCGAACTCG CGGCGATGTT CGCGAAACTT 
CTCCGTGGCG ACGAACGCCT CACGCTCAGA GCGTTGAAAC ACGGCGCGGC GAAATGGGGA 
GAGCAAACGT GGGACGATCA TTGGAAGCGC TGTGCGTTAC CTGTGTTCGC CGACGCGGCG 
TGA

Protein sequence

MTKRRTALVV LGDFGRSPRM QYHALSLARD ADRAVDVVCY SGTPPIDALS REDAVTMRYV 
VGCRWRWLTR VPLALALGTR VAAQCAHLFW ILMTMQRCEE MLIQNPPCVP TFLVCGIVCR 
ARRTRLVVDW HNFAYTLFGM KRGDASATTR MLKWYERTQG KMWGDAHVCV TKAMGNFLEK 
EWKIEGARVV EDRAAERFRE AAREATTPED ALDRFLRGTH ENMTKNKPRF IVSSTSWTPD 
EDFGVLLDAA VAYDARKRAK GDHASKSYPD IVIIITGQGP RKTMYEKKIN ELALEHVAFR 
TVWLDAADYP RALANAHLGV SLHTSSSGLD LPMKIVDMFG ASLPVAAMRY AVIGELVQEG 
VNGVLFADAT ELAAMFAKLL RGDERLTLRA LKHGAAKWGE QTWDDHWKRC ALPVFADAA