Gene OSTLU_43938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_43938
Symbol
ID	5004365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009365
Strand	+
Start bp	282429
End bp	283844
Gene Length	1416 bp
Protein Length	471 aa
Translation table
GC content	55%
IMG OID	640419786
Product	predicted protein
Protein accession	XP_001420297
Protein GI	145351898
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.270818
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.169117
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTGG TTATTTTCAT CTTCTTGCTC GATCAGCTCT CGCACGGACC GCTGAAGGGA 
CGAAAGTCGC CGCCGGTGAT CGACGTGGCG CCGGTGTGGG GCGGCATGTT GGCCTTTTTG 
GCGGGACCGA TGAAACTCAT GCGCGAGGCG ACGCCGAAGT ACGGTGAGGT GTTTACCGTG 
CCGGTGTTTC ACAAGCGGAT CACGTTTCTG ATCGGGCCCA AGGTGAGCGA GTTTTTTTTC 
AAGGCGAAGG ATACGGAGAT GTCGCAAAAG GAGGTGTACG AGTTCAACGT GCCGACGTTC 
GGTAAGGGCG TGGTGTTCGA TGTAGATCAC ACGACTCGTG CGGAACAGTT TAGATTTTTC 
GCGGATAGTC TCAAGAGTAA CCGATTGAGG ATGTACGTGG GGATGATGGT GAAGGAGGCG 
GAGGATTTCT TCAGCAAGTG GGGAGACGCA GGCGAGGTGG ATTTGCTCGA GCAACTCTCG 
GAGTTGATCG TACTCACGGC TTCCAGATGC TTGCTCGGAA GAGAGATTCG CGAGACGCTC 
TACTCTGAAG TTACCGATCT GGTGCACGAT TTGGATAAGG GTATGGTGCC GTTGTCGGTA 
TTTTTCCCGT ACGCGCCGAT CGAGGCGCAC CGCAAGCGAG ACGCGGCGCG CAAAAACTTG 
GCCAAGATTT TCGACAAAGT TATCCAAGCT CGTCGCGAGA GCGGCGCGAG TGAACCGGAT 
GTCTTACAAA CGTTCATCGA CGCCCGGTAC AAGGATGGTA GCAGGCTCAC GAACGACCAA 
GTCCTCGGTA TGTTGATTGC CGTGCTCTTC GCCGGTCAAC ACACGTCCTC GATCACGTCC 
ACGTGGACTG GTTTGCTGGC CATCGCGAAC AAGGAGCGCG TGATGCCTGC GCTCGAAAAG 
GAGCAAAAGG ATATCATGAA GAAGCACGGC AAGGATTTGG ATTTCGACAT CTTAGCGAAA 
ATGGATGAGT TGCATTTTGC TGTGAAGGAG GCGCTTCGAA TGCACCCGCC TCTCATCATG 
CTCCTTCGCA TGGCGCAAGT GCCGTTCGAG GTCGAAACCT CTACGGGTAA GAAGTACACC 
GTCCCCAAGG GCCACATCGT CGCCACCTCT CCCGCGTTCT CGCACCGCTT GGACAATGTC 
TACAGCGACC CGAACGAGTA CAAGCCTGAA CGATTCCGCG AACCGAACCC CGAAGACAAG 
GCCCAGTTCG CCTCCTTCAT CGGTTTCGGC GGCGGACGTC ACGGTTGCAT GGGGGAAACC 
TTTGCGTACA TGCAAATCAA AACCATTTGG TCCATCCTTT TGCGAAACTT TGAGTTCGAA 
ATGGTTGGAA AAGTTCCCGA ACCCGATTAC ACCGGCATGG TCGTCGGTCC CACCGCGGGC 
CAATGCAAAA TCCGCTACAA GCGCCGCGTT CTGTGA

Protein sequence

MTVVIFIFLL DQLSHGPLKG RKSPPVIDVA PVWGGMLAFL AGPMKLMREA TPKYGEVFTV 
PVFHKRITFL IGPKVSEFFF KAKDTEMSQK EVYEFNVPTF GKGVVFDVDH TTRAEQFRFF 
ADSLKSNRLR MYVGMMVKEA EDFFSKWGDA GEVDLLEQLS ELIVLTASRC LLGREIRETL 
YSEVTDLVHD LDKGMVPLSV FFPYAPIEAH RKRDAARKNL AKIFDKVIQA RRESGASEPD 
VLQTFIDARY KDGSRLTNDQ VLGMLIAVLF AGQHTSSITS TWTGLLAIAN KERVMPALEK 
EQKDIMKKHG KDLDFDILAK MDELHFAVKE ALRMHPPLIM LLRMAQVPFE VETSTGKKYT 
VPKGHIVATS PAFSHRLDNV YSDPNEYKPE RFREPNPEDK AQFASFIGFG GGRHGCMGET 
FAYMQIKTIW SILLRNFEFE MVGKVPEPDY TGMVVGPTAG QCKIRYKRRV L