Gene OSTLU_18085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_18085
Symbol
ID	5005569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	+
Start bp	324011
End bp	325306
Gene Length	1296 bp
Protein Length	431 aa
Translation table
GC content	60%
IMG OID	640420990
Product	predicted protein
Protein accession	XP_001421263
Protein GI	145353957
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.0963143
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.000212922
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTCGCAGG CGGGGACGTC GACGAAGGCG GGACGAGGCG CGGATGGGCG CGAGAGGTTC 
GTCGTCATTC GCGCGATGGG GCTGAGCGTG GACGGGAAGG TGGAGGCGGT GGTGGAGAGC 
GAGGCGTTTC CGACGCTCGA GGCGGCGATC GGGCACAGCG AGTACTTGGC GCAGACGGTG 
AGAGCGCGCG GGGGGGTTCG GGGGAACGTG GGACGAAACG GGGGGAAGAA AGGGATGAAG 
GCGTCGCGAA CGACGATTTG CGAGTTGCCG GTGGACACGC AGGTGTGGCA CGTGACGCCG 
ACGAATATTC CCGGGCCGGC GTATCGAAAC GAGGGGCAGC TCATGGTGAT GCTGCTGTCG 
AGTCTGTGCG GACGCGTGGT GTCGAAATCG CGCAATGGGG TGTTGGATGA GTCGGAGTTC 
GCGTACAACA ACGGCCACGG CGTGCGGTCG GCTCGCAACG GGGGCGACGC GGAGGCGCCA 
CAAATTGCGG ACGGCATTCC TTACGTCAAA GCAAAGATTT TCGGCCAGAA AACGGCTGAC 
CCATTCATGT TGCGCCCTAA CATCTCCAAG GCTGCGTTCA GAACGCTCCT CCTGCGCGCG 
GTGGGTAAGT ACCTGGCCGA CGATCGCGAG CCGTACCCGG TGCTGGCGAA ATCAGACGTG 
CAGCTTCAAG TCGCGCAAGT GGCTCACGGA GTCCAATACC ACGTTCTCGC GATTCGTGCG 
CTTGGACATT CCGCCGCGGA CTTTTCGATG TCCATCGATG ATCAAGGTCG AACCTTTGTG 
CGCGCCGATC CGGCGCAACC GCCAAACTCG AACCCGAAGT TGGGGCGGCC GTTCGAGCTG 
TTGTGTCAGT TCCCTTCCCT CGTGCACTTG CAAACGTGCC GCTGCATTTA TCAAGACGAC 
GTACTGTACA TCATTGTGTA TCCTCGTAAC GCCAAGTCGC GATCACTTCG TTTGTCTTCA 
GCAGAAATTA GAAACACGTC TTTGCCGGAA AGCATTCGAA ACACCGCGAC GGGCGCCGGC 
GTGGAAAAGG CCAACGGACC TTCGTTTCCG CGCGAAGTAG GGATCGAGGA TGGAACAAAT 
AGCGCTAGAC CGGGCGATGA GATTGCCTTG GCTACCCTTG GTGGCGCTTT TGGGAAGAAC 
GAAGATGACT CTGACTCCGA CAACACGGAT GACTTCTCGA ACGACGAGGC AGAGGAGCCA 
CGTGCCAAGA CTGCGGCGCC CGAGGTTGAT GAGAAGACGA TAGATTTACC AGACGAGGAT 
GTCGACAGCG AGGTGGAAGA GCCGATGCCC GAATAG

Protein sequence

MSQAGTSTKA GRGADGRERF VVIRAMGLSV DGKVEAVVES EAFPTLEAAI GHSEYLAQTV 
RARGGVRGNV GRNGGKKGMK ASRTTICELP VDTQVWHVTP TNIPGPAYRN EGQLMVMLLS 
SLCGRVVSKS RNGVLDESEF AYNNGHGVRS ARNGGDAEAP QIADGIPYVK AKIFGQKTAD 
PFMLRPNISK AAFRTLLLRA VGKYLADDRE PYPVLAKSDV QLQVAQVAHG VQYHVLAIRA 
LGHSAADFSM SIDDQGRTFV RADPAQPPNS NPKLGRPFEL LCQFPSLVHL QTCRCIYQDD 
VLYIIVYPRN AKSRSLRLSS AEIRNTSLPE SIRNTATGAG VEKANGPSFP REVGIEDGTN 
SARPGDEIAL ATLGGAFGKN EDDSDSDNTD DFSNDEAEEP RAKTAAPEVD EKTIDLPDED 
VDSEVEEPMP E