Gene OSTLU_92854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_92854
Symbol	SDG3513
ID	5002266
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009360
Strand	+
Start bp	136942
End bp	138861
Gene Length	1920 bp
Protein Length	639 aa
Translation table
GC content	61%
IMG OID	640417687
Product	predicted protein
Protein accession	XP_001418163
Protein GI	145347416
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.798313
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0275457
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCGCC CGTTCGAGCG CTTCGACGTC CCGGGCGCGC GCGACGGCGC CGTTTCGAAC 
GAGCGCGGCG TGCGCGCGAC GCGAACGATC CCCGCCGGCG CGCGCATAAT GACCACGGAG 
CCTTACGCCG CGGCGCTGCG CGCGGAGAAG CGCGAGAGCC ACTGCGCGTG GTCGTTTCAA 
CCGCTGCGCC TCGGCGCGCG CGCGCGCGTC GCGCGCGCGG CGTGCGGCGC GGCGTTCCGA 
GACGAAGAGA GCCTGAAACT CGCGAACACC GTCGAGGCGT TCGAACGCGC GAGCGCGTGG 
GTGCGAAAGT CGAGTCGAGG AACGCCGGAG ACGTCGGCGC GGTGCGCGCT GCAGTGCCTG 
GCGCGACGCG CGGGCGAGCG GGACGGGACG TGCGAACGCG CGCGGTACGA ACTGTTGGGA 
GAAGACGCGC GGGGATTCGA TGGGGTGTGG GCGCTGAGGG AATCGAGGGG ACGCGATGGG 
AAGAGCGCGC GGGAATTGGA GAAGGCGATG GAAATCGCGA GCGCGGCGAC GGTGGTGGCG 
GCGCTCGCGG GCGAGGCGAT GGTGAAGGGG GCGACGCCGG AGGAGATAGA GACGAAAATG 
CTCAACCTGA AGGTCGAGTC GGGGGTCGAC ACGCAGTTTG TGATCTCGTT GTTGTCGCGA 
TTTGAAATTA ATGGGTTCAC CATCGCGGAC GACGACATGC AACGCGTCGG TTTCGGGATT 
TATCCCGAGG CGTCTCTGTT TAATCACTCG AGCACGCCCA ACGCGCAGGT GATGTTCAAG 
GGTAAGACGC TCGTGGTGAA GACGTTGAGG GAAATCGCGG TCGGCGAGGA AATCACGATC 
TCGTACGGCG AGCAGTACAT GCCGCGAGAA TGGACGAGAC GCCGGATGCT CTCGTCGTAC 
GGTTTCGACG CATATGCGGC GTACCCCAAG TATGAAGTCG CGGAAGCGGC GCGGCGACGA 
GTCTTGGACG CCGCGACGCG AACGCGGCTT CCCATGCGAT TGGGCGAACT AGTCGATTTA 
GGCGAGGACG TGTGCTGGTA TGCGGGCGAA CTTCTTCCCG ACGAAGATCT CGCGCGCGAC 
CGGTTTTGGC ACCAACTCGA CGTCGACGCG TACGGGGACG AGTTTGCAAA CTCTGGAATC 
ATGCTCATCA AAGACGAATC ACGCGCACGC AAAACGAGCG ATGATGACGA CGACGATCAC 
GACGACGGTT GGAACGAAAA CAATGAGATC ATGATTTGGG GCAAATTCCC AGAACATTGC 
GACCGCGAGC TCACCGCCAT TAATTTTGCC AACGCCGCGC GCTCGCTCGA ACTTCTCGGC 
GCGGATGGCG AAGACGACGA CGAGGACGAC GATCGCGATC CCGTGATCGC ATTGCAGGGC 
TATGAGAAAG TGGCGCGCGC GTTGTTATCA GGAGACGATA AAGCAGCCGC AGTGGGAAGA 
AATCACGAGA TATTAAAGCA CGTCAATCTA AAACGGACGT TGAAGTTGAC GGAACTCACG 
GCGCGCGTGA TGCGAGATTT TGATGAACGC AAATCTGCGT GTTTCGTTGC CGTGGTGGAA 
AGTTCCGTGG GGGCATTTCG CGCGTGTCAA GCCACTGAAA CGGTGTACAA AATGAGCGCC 
GGATTCAGCC CGTTCGATTC CGTGTACGTC CATCTTAAAT TTCAAATGCT CAAGCTCGGC 
GTCTTGGCGT TGGGGTACCT CGCGCACCTG TGCGATCAGA GCGGTGCGCG CGCTGACTAT 
CGCAAGCTCG CTCGTGAGTT GTGCCGACAC GCGATTCTTA CCCATAACGA ACTCAAAACT 
GTCATGAGTA AAGCGAGCTG CGACGGCATG GTGATGCACA ACGAGTGGAG TCGAGATGCT 
CAATCACTTT TCGCCGACTT GAGCTTCATT CGTCAACGCA TCCAACAGTG GGGGAAATAG

Protein sequence

MSRPFERFDV PGARDGAVSN ERGVRATRTI PAGARIMTTE PYAAALRAEK RESHCAWSFQ 
PLRLGARARV ARAACGAAFR DEESLKLANT VEAFERASAW VRKSSRGTPE TSARCALQCL 
ARRAGERDGT CERARYELLG EDARGFDGVW ALRESRGRDG KSARELEKAM EIASAATVVA 
ALAGEAMVKG ATPEEIETKM LNLKVESGVD TQFVISLLSR FEINGFTIAD DDMQRVGFGI 
YPEASLFNHS STPNAQVMFK GKTLVVKTLR EIAVGEEITI SYGEQYMPRE WTRRRMLSSY 
GFDAYAAYPK YEVAEAARRR VLDAATRTRL PMRLGELVDL GEDVCWYAGE LLPDEDLARD 
RFWHQLDVDA YGDEFANSGI MLIKDESRAR KTSDDDDDDH DDGWNENNEI MIWGKFPEHC 
DRELTAINFA NAARSLELLG ADGEDDDEDD DRDPVIALQG YEKVARALLS GDDKAAAVGR 
NHEILKHVNL KRTLKLTELT ARVMRDFDER KSACFVAVVE SSVGAFRACQ ATETVYKMSA 
GFSPFDSVYV HLKFQMLKLG VLALGYLAHL CDQSGARADY RKLARELCRH AILTHNELKT 
VMSKASCDGM VMHNEWSRDA QSLFADLSFI RQRIQQWGK