Gene OSTLU_3050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_3050
Symbol
ID	5003496
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	-
Start bp	664241
End bp	665770
Gene Length	1530 bp
Protein Length	467 aa
Translation table
GC content	57%
IMG OID	640418917
Product	predicted protein
Protein accession	XP_001419451
Protein GI	145350080
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3670] Lignostilbene-alpha,beta-dioxygenase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.601284
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

AACTTCGCGC CGGTGGAGGG CGAGCTCGAG ACGCCCGTCG CGTGCGTCGT CGCGCGCGGG 
CGGTTGCCGG ACGATTTGGA CGGGTTGTAC CTGCGGAACG GCCCGAACGC GCGATTTCGA 
CCGGCGCTCG GGACGAATCG GTATCACTGG TTCGACGGCG ACGGCATGGT GCACGCGATT 
CGTTTGCGCG GCGAGGGCGA ACGAGCGGAG TATACAAGGC GGTACGTGCG CACGCGCGGT 
TTCGAGCGAG AAGAAAAGGC GAACGCGGCG CTGTACACGG GGCTCCGGGA TATAAATCCG 
ATTTGGCGGT ACTTGCTGCC GAGGTTGTTG GAAAAGATGA CCTTGGACGT TCGGCAGCCG 
GATTCGGCGT TCTTCGTCAT TCAGTCCAAG AATACGAGTA GTAACGGATT GACGCATCAT 
GCGGGGCGAT TGTTAGCGAC GTACGAGAGC GGTTCGCCGT ACGAGATCGC GTTAGAGCCG 
ACGCTGCGCA CGAAAGGGCT GTGCGATTTC AATCAGACGT TTGGCACGAT GGATTATTGG 
CTGGACAATT TCACCGCGCA TTCGAAGACG TGCCCGATGA CGGACGAGTT AATTTACATC 
GGGTACAATC TCGTGGCGCT GAGCGGCGAG CAGGATGGGC AGACGACGAT CACGGTTGGC 
GTGATCGACG GCGAGACGGG GAAACGCACG CACCGGCGGC AATTTAAAGT GCCTCGACCC 
TCGATGCAAC ACGACGTCGC CATCACGCCG ACAAAGACGG TGCTGATCGA TGGGCCGTTG 
ATCTTCAACT TGCCGCGCGT CATCGAAGGC GGACTGCCGT TTAGCTTTGA AAGAGAATGC 
ACGTTGCGTA TCGGATATCT CCCACGAAGA GGTGAGGAAG GGCCGTTTTG GATTGACACT 
GGCGAGACGT GCTTTGCGTA TCACGTCGTG AACGCGTACG AAGAAGGAAA TATTCTGACG 
TTGGATGTGT GCAAAGCCGA CGAAACGAAC GCGTTGGGGA TGTGCCAAGA GTCGAACGTG 
CCGCGTTCAA CGCCGGCGAA GAATCCAGTG AACGCCGGTC GCGACGTTGC GGCGTTGTGG 
AGATGGCAAA TCGACACCGA CGCTAACGCG ATAATATCGA GCAAGCGCCT ATGCGAACAG 
ACTTCCGACT TTCCGTGTAT TAACCGCAAG TACACTGGCT TAAAGTACCG CTTCGCGTAC 
TCGGTGGCGT ACAAATTGGG CACCGAACCA AAGTCGCGCA TGGACATTCC TCTGTTCGAC 
GCCGTACTCA AGCACGACCT ACAGTCAGGA GTGACGACTC GATACGAATT AGGTGAAGGT 
GTCACGTGTG GTGACATTAT TTTCGTTCCT TCGAAAGATG CCGCGCGCGA AGACGACGGT 
TATTTGCTCG TGTTGACACA CCTCGACGTC GACGGTGAAG AGCCTCGAGC AGAGTTATTA 
ATTTTAGACG CCTCGGGCGA CGAACTCACG ACGCAGTGCG TCGTGCATAT TCCAATGCGC 
GTACCGTACG GATTTCATTG CGAATATGTA

Protein sequence

NFAPVEGELE TPVACVVARG RLPDDLDGLY LRNGPNARFR PALGTNRYHW FDGDGMVHAI 
RLRGEGERAE YTRRYVRTRG FEREEKANAA LYTGLRDINP IWRYLLPSSN GLTHHAGRLL 
ATYESGSPYE IALEPTLRTK GLCDFNQTFG TMDYWLDNFT AHSKTCPMTD ELIYIGYNLV 
ALSGEQDGQT TITVGVIDGE TGKRTHRRQF KVPRPSMQHD VAITPTKTVL IDGPLIFNLP 
RVIEGGLPFS FERECTLRIG YLPRRGEEGP FWIDTGETCF AYHVVNAYEE GNILTLDVCK 
ADETNALGMC QESNNPVNAG RDVAALWRWQ IDTDANAIIS SKRLCEQTSD FPCINRKYTG 
LKYRFAYSSR MDIPLFDAVL KHDLQSGVTT RYELGEGVTC GDIIFVPSKD AAREDDGYLL 
VLTHLDVDGE EPRAELLILD ASGDELTTQC VVHIPMRVPY GFHCEYV