Gene OSTLU_94891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_94891
Symbol
ID	5004040
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009364
Strand	-
Start bp	431490
End bp	432818
Gene Length	1329 bp
Protein Length	434 aa
Translation table
GC content	60%
IMG OID	640419461
Product	predicted protein
Protein accession	XP_001420173
Protein GI	145351632
COG category	[I] Lipid transport and metabolism
COG ID	[COG3239] Fatty acid desaturase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.700078
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGACACG AGAGCGCGGA CGACGCGACG GCGACGGCGA CGGCGGCGGG CGACGATGGG 
AAGGCGAAGA AGCCGTGGGG GTTCCTGAGC CCGTTCGGCG CGAGCGCGGC GGTGCTGGAA 
CAGGCGGCGG AAGCGAACGA GAAGCAGAGC GGGCGCCGGC GACGGACGGA GGAAGTGAAG 
CTGAAGGTCG ATGGACAGTG GTACGATGCG ACGGGGTGGG CGCTGGCGCA TCCCGGTGGG 
GCGGGGTTCG TGCGGTTGTT GAACGGACAA GACGCGACGG ATGTGTTTTA CGCGCTGCAC 
TCGTACGGGC CGAACGGGAG CGACGAGGCG TTGAAACGCT TGCGCGCGTT GCCGAAGTGC 
GATGCACCGT ATGATACGGA AGAGTACGAA ACGCAAAGGC TGACGACGGC GAACGCCGAG 
TTCGGGGAGT TGCGAGGGAA GTTGGAGGCG GAGGGCTGGT TTAAACGCAA CGCGCTCTCC 
GAACTCTCGG TGTTGGCGCA AGTTTTGGGA TGCTACGTCG TCGGACAAGC CATCGCGGCG 
ACGCACCCGA TCTTAGCCGC GATCTCGATC GGGATAGGGA TGCAACAAGC CGGATGGCTC 
GCGCACGACT ACGTTCACGG CCGCGGGAAG TGGTGCTCGA TGATGCGCTG CTTTGGCGCG 
TTGACGAATG GGTTTTCCGC CGAATGGTGG TCGCACAAGC ACAACATGCA CCACTCGTTC 
ACGAACGTCG ACGGTAAGGA CGGCGACATC AAACTCGAGC CTCTGTATTA CTTGTCGCCG 
CCGGAGACCA GTGGGCGCCC GGATAGCTGG TTGCGCAAGT ACCAGCACAT CTACGGCTAT 
CCGCTCTACG CGATGACGTA CGTGCTCTGG CGCCGACACA GCGTCGCGAG TGCGTGGGCG 
CGCAAGGATA AGACTGAGCT CGCTTTGCTC GTCGGCCACT ACGCGTGGTT GTTCGGCACG 
CTTCCTTTGG GTGTCGCCAT CGGCTCCATG CTCATCGGTG GGTTTTTGGT AGGCTCTCTC 
GTCACCGCTA CGCACCAGAG CGAGGAAATC ATGTATGAAG ACGGTTCCTT CGTCGATATT 
CAGTTTAGAA GCACTCGCGA AGCGGACGTG AAGAATCCAC TCGAGCGTTG GTTGTGGGGT 
GGTATGGACA CGCAGCTCAT TCACCACTTA TTCCCCACCA TGCCGCGTTA CAAGCTTCAC 
AAGCTTCGTC CCATCATGCA GGAATGGGCC CAGAAACACG GATACGATTT TAGAATCTCC 
GATTCGCGCG ACATCCTGAA GAAGAACTAC AAACATCTTG AGGGTATCGC CGCATTGGAG 
ACGATTTAA

Protein sequence

MGHESADDAT ATATAAGDDG KAKKPWGFLS PFGASAAVLE QAAEANEKQS GRRRRTEEVK 
LKVDGQWYDA TGWALAHPGG AGFVRLLNGQ DATDVFYALH SYGPNGSDEA LKRLRALPKC 
DAPYDTEEYE TQRLTTANAE FGELRGKLEA EGWFKRNALS ELSVLAQVLG CYVVGQAIAA 
THPILAAISI GIGMQQAGWL AHDYVHGRGK WCSMMRCFGA LTNGFSAEWW SHKHNMHHSF 
TNVDGKDGDI KLEPLYYLSP PETSGRPDSW LRKYQHIYGY PLYAMTVASA WARKDKTELA 
LLVGHYAWLF GTLPLGVAIG SMLIGGFLVG SLVTATHQSE EIMYEDGSFV DIQFRSTREA 
DVKNPLERWL WGGMDTQLIH HLFPTMPRYK LHKLRPIMQE WAQKHGYDFR ISDSRDILKK 
NYKHLEGIAA LETI