Gene OSTLU_30690 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_30690
Symbol
ID	5000687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	-
Start bp	599857
End bp	601497
Gene Length	1641 bp
Protein Length	546 aa
Translation table
GC content	58%
IMG OID	640416108
Product	predicted protein
Protein accession	XP_001416993
Protein GI	145344963
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.221462
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGACGG CGACGCGCGG CGGCGCGCGC GTGGCGCGCG CGGGGCGATG CTCGGGGCGT 
CGCGCGCGCG CGTCCGGGCG CGCGCGACGG TCGGGGGCGA CGAAGGCTGG GGAAGACGAT 
GCGCTTCGAG GGACGCTGGA CGCGGTCGCC GTCGCGACGC TTCGCGCGCT CGGTGGCGTC 
GCGCGCGACG TCGCGGGAAA CGCGAACGTA AAGCCAGCGC GATTTCCGCG AGGACCGCGC 
GAGGACGTGG CGCTGGAGTT GGTGTACGAT CCGTTAAAGT TTTTGGAACG CGCGAGAGAG 
GCGCACGGCG ACGCAGTCGG GCTGACGCTC GCGGGAGAAA ACGTCGTCCT CGTCAGCTCG 
CCGGCGCTGG CGAGAGCGGT TTTGGTGGAT CAGAGCGAAT GTTTTCAAAA AGATGGCACG 
GCGTTCTTTC CTGGATCGTC GTTGGCGGGG AATGGGTTAT TGGTGAGCGA CGGCGAGACG 
TGGGCTCGAC AGCGACGGTT GAGTAATCCG GCGTTTCGCA AGGCGGCGGT CGAGACGTAC 
GCGCGGTGCA TGATTGAGGT AGGTGAGAGG TTAGTGAATA AGACGTGGTC GAGGCGGGGA 
AGGCGGGACG TGTACGCGGA TTTTAACGAT GCAACGTTGG AAATTGTGGC GAGTGCGTTG 
TTCGGGGCAG ACGTCGTCGG TGCGAGAGCG AGTAAGATTA ATGGTGCGAT TAAGGATAGC 
TTTGAATTTT TTGGTCGGCG AGCGGCGACG GGAATGATTA TTCCCGAGTG GGCGCCGACT 
TTTGATAACG TGCGGTACAA CGATGCGGTC AAAAGACTCG ATGAGGAGGT GTACAGTATC 
ATTGCCAAAC GTCGTCGAGC CATGGCGAGT GGAGAACAAA ATAATGAATT GGACTTGCTC 
GATCGTTTGT TGCTTGAAAA GGATGAGAAC GAGGGTGACG GCAACGACGC AACGGGGATG 
TCGGACAAAG CCCTTCGCGA TGAGCTCATG ACACTCATGG TTGCGGGACA AGAGACAAGC 
GCAATTTTGT TGTCATGGGC GTGCGCGCTC ATCGCTGAAA GGCCATATGT GGGCGATAAG 
ATAGCCACCG AGGTCCGACA ACACTTGAAA ACCAAGGAAA ATGCTGGCTC GTCGCTCGAT 
GCGAGTGATT TCTCGAAACT TCCGTACACC GAAGCGTGTA TCCTTGAGAC GCTTCGCATT 
CGCCCGCCAG CTTACATGGT GGGTCGATGC GCCGCGAGAG ATGTGGAGCT TCGATCTGAT 
GTGTTCATTA CGAAAGGAAC CACTGTTCTG ATCGCTCCGT ATCTGATTCA AAGAGATTCG 
CAGTATTGGA ACGACCCCAA AGCGTTCAAA CCCGAACGAT GGTTGGTGAA AAGTCCGTAT 
TCGGAAGGAA CGTTGGCGCG CGATGCGTTG AAAAATCTCG GACCAAATGA CGCATACTTC 
CCGTTTGGAG GCGGCCCTCG CGTGTGCATC GGCACTGGGT TCGCTATGAT GGAGAGTGTT 
CTTTTACTCG CACTTATTTG CAACGCGTGC GAACTACGTC TTCCCCCGGG ATCGAGCGCG 
CCAAAGCCAA AAGCTTTGAT TACCCTGCGC CCGGATGAAA TCAAGCTTGA CGTCGGACCG 
CGGCCAAGAA GCGTCTTTTA A

Protein sequence

MSTATRGGAR VARAGRCSGR RARASGRARR SGATKAGEDD ALRGTLDAVA VATLRALGGV 
ARDVAGNANV KPARFPRGPR EDVALELVYD PLKFLERARE AHGDAVGLTL AGENVVLVSS 
PALARAVLVD QSECFQKDGT AFFPGSSLAG NGLLVSDGET WARQRRLSNP AFRKAAVETY 
ARCMIEVGER LVNKTWSRRG RRDVYADFND ATLEIVASAL FGADVVGARA SKINGAIKDS 
FEFFGRRAAT GMIIPEWAPT FDNVRYNDAV KRLDEEVYSI IAKRRRAMAS GEQNNELDLL 
DRLLLEKDEN EGDGNDATGM SDKALRDELM TLMVAGQETS AILLSWACAL IAERPYVGDK 
IATEVRQHLK TKENAGSSLD ASDFSKLPYT EACILETLRI RPPAYMVGRC AARDVELRSD 
VFITKGTTVL IAPYLIQRDS QYWNDPKAFK PERWLVKSPY SEGTLARDAL KNLGPNDAYF 
PFGGGPRVCI GTGFAMMESV LLLALICNAC ELRLPPGSSA PKPKALITLR PDEIKLDVGP 
RPRSVF