Gene OSTLU_14601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_14601
Symbol
ID	5000997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	-
Start bp	415899
End bp	417854
Gene Length	1956 bp
Protein Length	651 aa
Translation table
GC content	54%
IMG OID	640416418
Product	predicted protein
Protein accession	XP_001416942
Protein GI	145344860
COG category	[I] Lipid transport and metabolism
COG ID	[COG0365] Acyl-coenzyme A synthetases/AMP-(fatty) acid ligases
TIGRFAM ID	[TIGR02188] acetate--CoA ligase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0178596
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCATC GCTCAATTCA CGAGCGTGAT CAGTTCTGGA CCGAGATCGC GGGCGAACTG 
TACTTTGAAA ATTTGGACTC GAGCGCGTCG ACGCACAACT TTGACCCGTC TCGGGGGCCC 
GTTCACGTGA AATGGTTCGA GGGCGCGAGG ACGAACATGG CGTACAACTG CCTCGAAAAA 
CAAATTGAAA ATGGTATGGG TGACAAACGA GCCTTGATTT TCGAAGCGAA TGATGAGATT 
AATTGCACGG AATTTACGTT CCGTGAGTTG CTCGTCGAGG TGGAGACTTT CGCAAAATTT 
TTGATAGCGC ACGGCGTGCA GAAGGGCGAT CGCGTGGTCA TGTACTTGCC GATGATTCCA 
GCGTTACCGA TCGCCATGCT CGCGTGCTCG CGAATCGGCG CAGTGCACAG CGTTGTGTTT 
GCCGGGTACA GCGCGAAATC TCTCGCGCAG CGCGTTCACG ATTGCAAAGC CAAAATGGTC 
ATCACCGCGA GCGCGTCCCG TCGCGCCGAA AAGATCATTC CGCTGAAGAA AATCGTGGAC 
GAAGCAATGG AGATTTGCAA GAGCGATGGG TTTTGCGTAA ACAAAGTTGT CGTGAAGCAT 
AACGCTGACA TTGAGATCGA AGGCGTTCCG CACGTCGAAG ACGTACCTTT TCATTCGGAT 
CGGGATTTGT GGTGGAACGA GAGTGTCGCC GAGTTTAGGA CGGATGGAAA GCCAGCACCT 
ATTGAATTTC TGGACAGTTG CGACACGGCG TTCATTCTCT ACACGTCTGG TTCGACTGGT 
AAACCCAAAG GCGTCGTACA CAGCGTCGGC GGTTATCAGA CGTACGTGTA CGCCACCAGC 
AAGTTCGTCT TCGATCTACA TGCCGGAGAG GACGTTTTGT TCTGCACCGC CGACCTAGGA 
TGGATCACGG GGCATTCATA CGGCTTGTAC GGACCGCTGT TGAATGGATG CGCGACTGTG 
CTCTTCGAAG GCGTGCCTAC GTATCCAGAT GCAGGTGTGT GGTGGCAAAC TGTGGACAAA 
TACGACGTTA CTGTCTTCTA CACTTCGCCG ACGGCGTTGC GCACGTTGCA AGGTTACGGT 
GAGGATCCTG TCAAGCGAAG TTCGCGCGCT TCTTTGCGAA TCCTTGGAAC TGTCGGCGAG 
CCGATTTCGA GCGAGACGTG GCTGTGGTAC CACAGCGTCG TCGGCGACGA TAAACTCCCG 
ATTTGTGACA CGTGGTGGCA GACAGAAACG GGCGGTCATA TCATCACACC GTTACCCGGT 
GCGACACCCT TGAAGGCTTC GAGCGCGACT TTTCCGTTTT TTGGAATCGT TCCCGTGCTG 
CTTGATCCGA AAGATGGAAC TGAAATTCAA GGCGAGGGCG AAGGATGCTT GTGCATCAAA 
GAACCATGGC CGGGGATGTT TCTCGACGTT CACGGCGCGC ACGAGCGGTA CGAAAATTCT 
TACTTCAAGG TGTACGAGGG TGGTTACTAC TTCTCGGGCG ATGGCGCGCG ACGCGATTCC 
GATGGATACC TCTTCATCAC GGGTCGCTTG GACGACGTCA TGAACGTCAG TGGTCATCGC 
ATCGGGACCG CCGAGGTTGA GTCTGCATTA GTGCAGCACT CGAGTTGCAT CGAAGCCGCC 
GTGGTTTCAA TCGCGCACGA AGTCAAGGGC GAATCCATCG TCGCTTACGT CATCTTAGAT 
CCGTCTCGAA GCATCGAGAA ACGGTCGTCG CTCGAAATCC ATCAACGAGA ACTCATCACG 
AACGTTCGCA TGGAAATCGG CCCCTTCGCG GCGCCAGAAC GCGTCGTCAT CGTGAAAGAT 
TTGCCGAAGA CTCGAAGCGG AAAGATCATG CGAAGAATTT TGAAGAAAAT CGCCGCCGGC 
GACGTCGACG ATTTCGGCGA CGTCTCCGCG TTGGCCGACC CGGGGGTCGT AGACGAGATC 
ATCAAAGCCG AGAGACACGC GCGCGGAACG CGATGA

Protein sequence

MYHRSIHERD QFWTEIAGEL YFENLDSSAS THNFDPSRGP VHVKWFEGAR TNMAYNCLEK 
QIENGMGDKR ALIFEANDEI NCTEFTFREL LVEVETFAKF LIAHGVQKGD RVVMYLPMIP 
ALPIAMLACS RIGAVHSVVF AGYSAKSLAQ RVHDCKAKMV ITASASRRAE KIIPLKKIVD 
EAMEICKSDG FCVNKVVVKH NADIEIEGVP HVEDVPFHSD RDLWWNESVA EFRTDGKPAP 
IEFLDSCDTA FILYTSGSTG KPKGVVHSVG GYQTYVYATS KFVFDLHAGE DVLFCTADLG 
WITGHSYGLY GPLLNGCATV LFEGVPTYPD AGVWWQTVDK YDVTVFYTSP TALRTLQGYG 
EDPVKRSSRA SLRILGTVGE PISSETWLWY HSVVGDDKLP ICDTWWQTET GGHIITPLPG 
ATPLKASSAT FPFFGIVPVL LDPKDGTEIQ GEGEGCLCIK EPWPGMFLDV HGAHERYENS 
YFKVYEGGYY FSGDGARRDS DGYLFITGRL DDVMNVSGHR IGTAEVESAL VQHSSCIEAA 
VVSIAHEVKG ESIVAYVILD PSRSIEKRSS LEIHQRELIT NVRMEIGPFA APERVVIVKD 
LPKTRSGKIM RRILKKIAAG DVDDFGDVSA LADPGVVDEI IKAERHARGT R