Gene OSTLU_18123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_18123
Symbol
ID	5005595
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	-
Start bp	421910
End bp	423706
Gene Length	1797 bp
Protein Length	598 aa
Translation table
GC content	55%
IMG OID	640421016
Product	predicted protein
Protein accession	XP_001421465
Protein GI	145354383
COG category	[A] RNA processing and modification
COG ID	[COG5186] Poly(A) polymerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.622688
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGGCG CGCAGACGCC CTCCGCACCG TCGGTCATGA CCCAGTCGGC GTCCGCGGAG 
GCGCTGAATC GCGTGATGTC GAACGAGATG CCGACGGCGT TCGACGAAAA GTTGAGCAAG 
GCGCTCGATG ACAAACTGCG GGAAGAGGAC GTGTACGAAG ACGCGGACGA GTGCGTGCGA 
CGCGAGGAGG TGCTGGGGGA GATAAACGCG TTGTTGCAAG ACTGGGTGCT GGCGGCGAGC 
GAGCGAAAGG GGATCACAGA GGATATGCGG CCGTCGTGTA ACTTGTACAC GTTTGGGAGC 
TATAGATTGG GCGTGCACGG ACCGGCTGCG GATATCGATA CGCTGTGCCT CGGGCCGAGA 
CATCTGAGCC GAGAGGAGGA TTTCTTTGGA TGGGATGAGA ATGATTACGA AGGGTCGTTT 
TATGACGTGA TGCGGAAACA CCCTGGAACG GAGAGCATCG TGCCCGTGCG CGACGCCATC 
GTGCCAGAAA TCAAACTCGT GTTTAGAGGT TTTGAAATAG ATATGGCGTA CACGAGCTTA 
CCGTCGTACA CGCACGTGCC AGAGGACTTA GACGTGTGTC AGACGTCGGT GATGATGAAT 
TTGGACGACC CAGGGGTGAA ATCCCTGAAT GGTTGTCGCG TGGCGGATCA GTTGTTGCGC 
GTCGTGCCAA ACCACGACGC GTTTCGAGTG GCGCTTCGCA CGTTGCGTCT GTGGGCGCAG 
CGGCGCGGGG TGTATAGCAA CGTCGTCGGG TTTTTCGGTG GCGTAAACCT GGCGATTTTA 
GTAGCGCGCG TGTGTCAGTT GTACCCCAAC GCCGCACCTT CCATGCTCGT GTACAGCTTT 
TTCCAACTAT GGTCGGCGTG GCAATGGACG ACGCCGGTGA TGCTCGTACC CATCGTCGAC 
GAAGGCTTAC CCGGGATGCG AGTGTGGGAC GAGCGTGTGA ACAAGGCAGA GCGATATCAG 
TTGATGAAAA TCTTAACTCC GGCGTATCCG GCGCAAAACT CTACGTTCAA CGTGAGCGTC 
AGCACGCTCG AGGTGCTCAA AGCCGAGTTC AAGCGCGGCA AGGAAGTGAC CAAGATGATT 
CTTTTAAACA CCGCGAAGTG GGAGCAGCTG TGGTGTTCGT TGAACTTTTT AGAAAAATAC 
AAGCATTATT TGATGGTTAC CATCTCGGCC AAGAACGAAG ATGACTTTAA GAAGTGGGAA 
GGTTGGGTCG GCTCGCGAAT CAAGCTTTTA ATCCAAGGCA TCGAAAACGC CACGGGAGGG 
CAAATGCTTG CGCATCCCGG CACGTCGAGG TACAAAGATC CGGAGAAGGA CGAAAACTCG 
CACGTCACGC TGTTCTTGGG GTTATTTCCT TCGAGCCTGA AGAAGAAGGA GGAGAAGGTT 
TCGCTCAACT TGAATCCCGC GGTGGAGCAG TTCCAAATGA CTGTGACGTC GTGGATGGAT 
CGCGCGACTG GGGAATCGAA CTGGGTACCC GGGATGCAGG CGAACGTCAA ATATTTGAAG 
CGCAAGGATT TACCGAGCTT CGTGAAAGAA GAAATCGACG GCTACGTCAA GGACATCTAC 
GCGCCGGAGA AGGAGAAGAA AGCGGCGAGC GCGGAGGACG AGGAAAAGAA AATCTCCGAA 
GAGAAACCTT TGCCCCTGGG AGACGATACG AAGGCGGCTC GCAAACGCAA AGAAATGCAA 
GAAGACGATT CAATCACGCA ATTGGACTCG CTCAACGATG ATTTACACGC GGGGACGGAG 
ACCGCGGCGG CGAAGAAGGT CAAAGTGAGC TTCGCGCAAG TCGTCGCGAA GAAATAG

Protein sequence

MIGAQTPSAP SVMTQSASAE ALNRVMSNEM PTAFDEKLSK ALDDKLREED VYEDADECVR 
REEVLGEINA LLQDWVLAAS ERKGITEDMR PSCNLYTFGS YRLGVHGPAA DIDTLCLGPR 
HLSREEDFFG WDENDYEGSF YDVMRKHPGT ESIVPVRDAI VPEIKLVFRG FEIDMAYTSL 
PSYTHVPEDL DVCQTSVMMN LDDPGVKSLN GCRVADQLLR VVPNHDAFRV ALRTLRLWAQ 
RRGVYSNVVG FFGGVNLAIL VARVCQLYPN AAPSMLVYSF FQLWSAWQWT TPVMLVPIVD 
EGLPGMRVWD ERVNKAERYQ LMKILTPAYP AQNSTFNVSV STLEVLKAEF KRGKEVTKMI 
LLNTAKWEQL WCSLNFLEKY KHYLMVTISA KNEDDFKKWE GWVGSRIKLL IQGIENATGG 
QMLAHPGTSR YKDPEKDENS HVTLFLGLFP SSLKKKEEKV SLNLNPAVEQ FQMTVTSWMD 
RATGESNWVP GMQANVKYLK RKDLPSFVKE EIDGYVKDIY APEKEKKAAS AEDEEKKISE 
EKPLPLGDDT KAARKRKEMQ EDDSITQLDS LNDDLHAGTE TAAAKKVKVS FAQVVAKK