Gene OSTLU_36317 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_36317
Symbol
ID	5000077
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009356
Strand	+
Start bp	198814
End bp	200718
Gene Length	1905 bp
Protein Length	588 aa
Translation table
GC content	63%
IMG OID	640415498
Product	predicted protein
Protein accession	XP_001416100
Protein GI	145342029
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0426] Uncharacterized flavoproteins [COG1853] Conserved protein/domain typically associated with flavoprotein oxygenases, DIM6/NTAB family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGTCGT TCGCGACGCG CGCGCGACGG ACGTTCGAGG TGGAGTACGG CGCGCGGCGA 
GGGACGACGG AGAACGCGTA CGCGACGCGA GGCGAAAAGG ATGCGTGCCT GATCGATTGC 
GTCGACGGGA GACACGCGGA GGGGTACGCG CGCGAGATCG AGGGGCTGGG GGCGTGGGCG 
CGCGACGCGG CGTATCACGC GGTGCTGCAC GTGAGTCCGC GGCGGTTGGA CGCGCTCGCG 
GCGGCGATCG CGAACAGGAG CGAGGGCGCG GCGTGCGTGG AGGTGCTGTG CTCGAATCCG 
GGGGCGCAGT TGATTCAACA GGCGCTGAAA CCGAATAGTC CTCTGACGAA TGAAGCGCTG 
TGTGCGGCGT GGAAGGGGAC GGATGGGAAA CTGAGGGCGC GGTTGCGCGT CGTGCGCAAC 
GGCGAGCGGT TGGATTTGGG CGGGCGGACT TTGAGATTTA CGCTCGCGCC CACGCCGCGT 
TGGCCGGATT TGATCTTCGC GCGCGATGAG AAGTCGCAAA CTCTGTTTAC ATCGAAGTTT 
TTCTCCGCAC ACGTCGGCAC GATGGAAGGA TACGGCGATG AGGGCGGGTT GGAGACGTTC 
GGGGAGGATT GGAGGTTTTA CTTTGACTGC CTCCTCGCGC CGATGGCGAG GCAAGTGTCG 
CCTTTGCTCG AGAAGCTTAC CGTGAAAGAA GAGAACGCGT ACGACGAACG GATGGGACGA 
CGGATGGAGG AGTGGGAAAA GAGCGGCGCG GTGAAAAAGG TTTTGCTGCG CGCGATGGGC 
AAGTCCATGG CGGGGAAAAC GAGCTCGCAA GCGTTCGAGG GCGTCGCGAA GACTATTTGC 
CCGGCGCACG GCCCGGTCGT CGCGTCCTCG GTCACGGAGC TGTATCGAGA GTACGTAGAG 
TGGTGCAAAA TGCAAACTTC CGCTGGGGAT AACTTGTCCG TGGCCGTCAT CTACGCCAGT 
GCGTACGGGA ACACCGGCGC GATGGCGCAA GCCATCGCGC GAGGCGTCGC CAAGACAGGC 
GTCGGCGCGG AAATGTTCAA CTGCGAGCTC GCGTCACCGA TCGAAGTGGA AGAAGTGTTG 
AAACGTAGCG CGGGGTTCGC CCTCGGTGCA CCGACGCTCG GTGGCACTTT ACCGACGCCC 
GTGCAGACCG CACTCGGGGC GATCGTGAAG GAGGGCGATT TGGAGAAGCC GTGCGGCTCC 
TTTGGATCCT TTGGCTGGTC TGGCGAAGCG GTGGCGATGA TCGACAAACG CTTGACAGAC 
GCGGGCTTTA AAAGTGCGTT CGAGCCGTTG CGGTGTAAAT TCAAACCTAC CGCCGAGACG 
CTGCAGCTTT GTGAAGAGAG CGGGACGGAT CTCGCGCAAG CGGTGCGCAA GATCGAGCGC 
CGCAAACAAG TGCTCGAGCG TAAATCCGTC GGCCAAGCCG CGGACGGCGT CAGTGACACC 
GCCGCCGCCG TCGGGCGCAT CGTCGGCTCG CTATGCGCGG TGACGACGAA GAACGAAGAC 
ACGCAAAGTG CCATGTTAGC GTCTTGGGTA TCTCAAGCGA GCTTCAATCC GCCGGCGCTC 
ACCGTCGCCG TCGCCAAGGA GCGCGCCGTC GAGAGTTTCC TCATGACCGG CGGCAAGTTC 
AACCTCAACG TCCTCAAGTC CGGCGGCGAA AAGGACGTCA TGAAGGCCCT ACTCAAACCG 
TTCGCTCCCG GTGAGAACCG TTTCGGCGCG CTCGACGTAG ACATCTCCGA AACCAACGGC 
TGCGCCGTGG TGAAACAGGC CCTCGCGTGC GTCGAGTGCA CCGTCACGAA GCGAATGGAG 
GCCGGCGACC ACTGGGTCGT CCTCGCCGAA GTCGAGCGCG GGACTCTCTT AGACGCCGAA 
GGCGTGACGA GCATCCACCA CAGAAAGACT GGTAGTTCTT ATTAA

Protein sequence

MVSFATRARR TFEVEYGARR GTTENAYATR GEKDACLIDC VDGRHAEGYA REIEGLGAWA 
RDAAYHAVLH VSPRRLDALA AAIANRSEGA ACVEVLCSNP GAQLIQQALK PNSPLTNEAL 
CAAWKGTDGK LRARLRVVRN GERLDLGGRT LRFTLAPTPR WPDLIFARDE KSQTLFTSKF 
FSAHVGTMEG YGDEGGLETF GEDWRFYFDC LLAPMARQVS PLLEKLTGVA KTICPAHGPV 
VASSVTELYR EYVEWCKMQT SAGDNLSVAV IYASAYGNTG AMAQAIARGV AKTGVGAEMF 
NCELASPIEV EEVLKRSAGF ALGAPTLGGT LPTPVQTALG AIVKEGDLEK PCGSFGSFGW 
SGEAVAMIDK RLTDAGFKSA FEPLRCKFKP TAETLQLCEE SGTDLAQAVR KIERRKQVLE 
RKSVGQAADG VSDTAAAVGR IVGSLCAVTT KNEDTQSAML ASWVSQASFN PPALTVAVAK 
ERAVESFLMT GGKFNLNVLK SGGEKDVMKA LLKPFAPGEN RFGALDVDIS ETNGCAVVKQ 
ALACVECTVT KRMEAGDHWV VLAEVERGTL LDAEGVTSIH HRKTGSSY