Gene OSTLU_27074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_27074
Symbol
ID	5005030
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009367
Strand	+
Start bp	164663
End bp	166813
Gene Length	2151 bp
Protein Length	659 aa
Translation table
GC content	61%
IMG OID	640420451
Product	predicted protein
Protein accession	XP_001420922
Protein GI	145353228
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.00289082
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00000904568
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCGCTCC GGTTGCAGAA AAAGGCGTCG CGCGTCGTGC GCGCGGTGGC GGAGGAGGTC 
CAGGTCGCGC GCGGCGTCGG CACGCGCACC GATAAGCGCG GGAACGCGAA GACGGCGCTG 
TGGGAGCGCG GCAAGGTGCG ATCGAGCGGC GGATTGGCGC GTGTCTCGAT CGGCGCGACG 
AGGATCGCGC GCGAACGCGC GACGCGAGGC GACGCGCGAC GCGCGCGCGC GGAGACGCGA 
AGGGAAACCC GCGCGGGAGA TTCGGGGAGA CGCGCGAGAG ACTGACGGGA CGCGGACGCG 
ACGCAGGCGA AACTCGCGGC GACGGCGGTG GAGAAGGAGT TCGCCGAGAC GCAGTTGGCG 
TTTAGCAAGG CGACGAATTT CGATGACGTG CCGCCGAAGG AGAAGCACGT GCTGGCGCTG 
GTGCGCACGT GCGGAGGCGC GGGCGGAGGG AGCTCGAGGG ATCGGGCGTT CGTGTTGGAG 
ACGTTGGCGA GACAGGTGCG GAAGTGCGCG CCGTGGAGGA CGATGCTGAA GACGCACGTG 
TTGCTGCACA GGTTGATGCG GGAGTGCGAG GGAGGGGGGT TTAAGGATGA CTTCTTCAGG 
TTTTTGGAAT TTTTATCTCG GAAAACGTAC GGGCCGAAAG AACAGACGCT GTTTAACATT 
CGCTACTGGA AGGACGAGAC CAACAAGGAC GCGTACGAGT TGTCGGGGTG GACGCGCGCG 
TACGCGGCGT ACCTCGAAGA GCTGTGCGCT TTGAATGAGT TCATCCCGAG CCTCGTAGGA 
AACGTGAGTG GCGCGGTGAC GACGACGACA AACGGCGAGG CGCGAGCGGT GGTGGCGAAT 
CCGTTGAAAG ATTGTGATTT CGCGACGTTG ATCAAGGTTT TGCCCTTGGT GCAGACGCTC 
GTGCGACGCA TCACGGATTG CGCGCCAACA TCTACGACGC TGCAGAAAAA TGCCGTCTCG 
CGATACGCCG TCGGACTCGT CGCAAAGGAT AGTTTCTTGG TGTATCGCGT CATGAACGAG 
GGCATCATAA ACCTGGTGGA CAAGTACTTT GAAACGAGCA AAGTCGAGGC GGAGAAAGGG 
TTGGTGATTT TCAAAAAGTA CTTGACGCAA ATCGAAGACT TGCAACGATT TTACGACACG 
TGCGAAGCGT GCGCGGCGGT GGAAAACGCA GTCGTCAAGC TTGAAGCACC CCCTGCGACG 
TTTTTGAAGA GCATGGAAGA GTACTTCGAA TCGGCGCCTC GCGAAGGCTT GCCTCTTCGC 
GAGCGGCGGT TGGGCGCGAC ATCTTCGACG ACGGCGAACA ATGCACGAGC GAATGCGGTG 
GGGTCGACAA TGTTGGCGAT CGACGTCCCC GCCAACAACG CGGACTTTAT CAGTACCACT 
GCTGCGCTAC CGCCGGTGGA GCCGTTGAAT GCGCTCGATG CGCTCAGTCA GCTTGATTTA 
GGTACGCCGA GCCCAACGAG CAAAGACGAT GTTTTTAGCT CAAACGCGCT GCCCGCGCCG 
ACGCAACCGC CGGCGTTAGC GCCGGTCGCG CCCGCAGCTT CGAGCAGTAC AAGCGCACTT 
GATTCTTTCT CCGAGTCAAT CGCTCCGGCG GTGCCGACGG AACCCTCTGC GGTGGCGTAC 
AACCCATTCG GAGCGAACCC ATACGGCGGC GCCCCGCAAA TGGTGCCGGC GGCTCCGCAA 
ACGGCGCCGG CGCCCCAAGC AAAATCGCCG AGAAGCACGA ACCCATTCGG AAATAACCCG 
TTCGGTACAC CACAGCCTCA AAGTTTGGAC AAGAGCGCAC TCAATGACTT ATACGCGCAA 
GCTCCAGCGT CACCCAGGAG TGGCCATGGC ATGAGTTCCA TGGCACCGCC GCAACACATC 
AATCCGAGCT TTATGCAAGC GCCGCCCAAC AGCGCCTTGC AGCGGCAGCA AGTTGGCGCA 
CCTCAGCTAG CGCTACCGAT GGCTGGTGTG CAGTATCCAC AACAATATCC GCAGATGGCG 
TTCCCCCAGC ACCATCAGCA GATGGGATAC CCGCAGCAGC ATCCGCAGAT GGGATATCCC 
CAGCGCCCGG CGGCTGAACC ACCGTTGCAC CCGGCGTTCG CCAACCCTCA CCAAGGCGGC 
AGTCCAAGTT CTAGCGCTCC ATCACCGCAG AACTCCGGCA GTTTGATTTG A

Protein sequence

MPLRLQKKAS RVVRAVAEEV QVARGVGTRT DKRGNAKTAL WERGKAKLAA TAVEKEFAET 
QLAFSKATNF DDVPPKEKHV LALVRTCGGA GGGSSRDRAF VLETLARQVR KCAPWRTMLK 
THVLLHRLMR ECEGGGFKDD FFRFLEFLSR KTYGPKEQTL FNIRYWKDET NKDAYELSGW 
TRAYAAYLEE LCALNEFIPS LVGNVSGAVT TTTNGEARAV VANPLKDCDF ATLIKVLPLV 
QTLVRRITDC APTSTTLQKN AVSRYAVGLV AKDSFLVYRV MNEGIINLVD KYFETSKVEA 
EKGLVIFKKY LTQIEDLQRF YDTCEACAAV ENAVVKLEAP PATFLKSMEE YFESAPREGL 
PLRERRLGAT SSTTANNARA NAVGSTMLAI DVPANNADFI STTAALPPVE PLNALDALSQ 
LDLGTPSPTS KDDVFSSNAL PAPTQPPALA PVAPAASSST SALDSFSESI APAVPTEPSA 
VAYNPFGANP YGGAPQMVPA APQTAPAPQA KSPRSTNPFG NNPFGTPQPQ SLDKSALNDL 
YAQAPASPRS GHGMSSMAPP QHINPSFMQA PPNSALQRQQ VGAPQLALPM AGVQYPQQYP 
QMAFPQHHQQ MGYPQQHPQM GYPQRPAAEP PLHPAFANPH QGGSPSSSAP SPQNSGSLI