Gene OSTLU_28298 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_28298
Symbol
ID	5006176
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009371
Strand	-
Start bp	174071
End bp	176464
Gene Length	2394 bp
Protein Length	797 aa
Translation table
GC content	49%
IMG OID	640421597
Product	predicted protein
Protein accession	XP_001422222
Protein GI	145355982
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.126698
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.061599
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGGCAC TACAGCAACG CGAGAGAATG GCGGTGTTGT CGGGTTTGGT CAAAGCGGCG 
GACGACGCGT TTGACCGAGC CGAGATCGAC GACGTCACGA AAGAGTTGTT TCTCGACACA 
CAGATCGAGG ACGAGATGAA AGAGATGTTC GACATTGCGA GACGAATTCA ATTTTTTGAT 
GAAACGGGAA AGTTGGAAGG CGCTCTGGAG TTGGTGAAGG ATTTCGAAAA GTACGCGCGG 
AGCGAGGATT CGAAAGTCGT CGCAGTCGCG GTGTGGTGCG GGGCGTGGAG CGCGATTCAA 
AATGAACTTT TTAGACGTAG CGAGTGGATA CGAGTGCTCG AGAAACTGTT TTGGACGATC 
CACACGCTCT GTTTGAGTCA TCGCTTCAGC AAAATCCGCG CGTGTGCGGC GATTCAGTGC 
GGGGAGTTGG CCACCGCCGC GATGTTGAAG TTGTGCGATT TGCGCGTGCA CGAGGCATAT 
GCTCGTGATA TGTTACGCTT GAGCTTAGAT GAAAAGTGCA CAGTACGACA CGCCGTGTCC 
TGTAGCGTCT CCATGTGCTT CGTTAGACGC ATATATTCTG GGCTTTTCAC CGTAAGAGAA 
GCGGATGCAG CTTTGCTGTG CGCGATGTTT GTGAGTGCCG TCGGGAAAAG AAATCCTTTT 
GCGCACATCG ATTACGTGAA CAAAGCGCAC TTGACAAAAA CTATGAATGA AGGGTTTGCA 
TCAGTGACGC ACTATACCTT AGAACGAATG ATTCAGTGCA TGTTAAACGA TCAGCTGTGG 
CGCACGGATG ACAAAGACAT CCTTGGACGG CGTCTCCGCG CGTGCGCGCT CATCGTCGAA 
CACGTCGGCG ATCGCGTTGC CCCGTTCGTC GATTCAATCA TCAAGATGTT GCTAGATACT 
TTGACCAAGA GTCTTGTTTG GCGCGATGCG GAATATTTGA TGGAAATATT GATGATTCAC 
GCGCCCTCGA CGCGTAGGAC GTGGGTTGAA CCGACGATGC TGCACGTAAA CTCCGAGTTT 
ACTTTGCACA TGGTTGCTTT GTGTGTATGC GAAAAATTTC TCTCTAGAAG AAAGCAGCAT 
GGCGTCACAC ATGCACTCAA CTTGGATGAT GTTGCGTTCA TTTCAGAAAG TCTGGAGAAG 
ACTATGTTTC GATTGGATTC ATGTGACAAG CTAGATGATT CAAGTGGCGT CCTAAATTGC 
GTCGAAAGTA TCCTTGCGTC ATGTTTAGAG ATTCTTCGTC AGCAGAATAA GGCTAGCATG 
GCGACGCGAA AGTTCAAGAA ACTTGAAGCA TGTGTGAAAA TTCAGACTAT GTACTTTTGT 
GTGTGCGGAA TGTCTTCCAT CGACGTAACT GGCGAGATGT TGATGGCATG CACTCCAAAG 
GATGAAGTTG AGGCATCGGA GATATTTCGT CTCATCGTCG ACCGTAACGT ACCACTACGT 
TCGTTCCGGG CAAATACACT CACGGCGCTT TTTTGCCTTC TTCGCGGTAC GCAACTGGTT 
GCTGAAATAT CGGAATGTCT CGCCCAACAA ATCGACCCAG CGACGTGTGA TGCATCATTG 
GATTCACTTC TTACAGTCAA AGACTTCATG GTACCATTCA TCTTGTACTT GCGATCACGC 
GGCGATGAGA CACTGAATAA GGCGGATTTT GTCACAAATA TCGCTCCAGT TCTGGACGCT 
TTGCTCGATT GGATGCGATG GAGACCGGGT GAAATGACGG CGCAGCTTGC CGATATAGCC 
GCCACGTGTT TCGCCGTTCA AAATTCATTG AGTGAGCCAA TTTCGTATAA TGATGAAATT 
GGCGAGTTTG TGGAATCCCT GACAGATGAG CAATCCGAAG AAAGTGCGTT GCAAACATTC 
TTGACGCGCT GGTTATCACT AGAAAATCGT TCAAAGCGAG TGATAGACGT GATATGTTCG 
ATGTCATTCG AAAAAACGTC GTCTGTCTTT TGCCGGCAAA AGAGAGACGC CATGTTGCAT 
TTGCAAAAAT GTGCATGTTT GGCAGACAGA CAAAACGCAG TAAAATTTCT CGAGCGCGTC 
GCATCCAGAT ATTTAGAGCA AGTCTCGACT TCCTCAAGTA CTCAGGTTCG TGTTCGTTCG 
TTGTTAGCCT TGGGGAAAAC CATTGCACAG TTGATACGCG ATTTTAACGA CCATCAGACG 
GCTAAGAAGT TTGTGGGAGA CATCTTCGTG TTCGCCGATG ACGCCGACAA AGCCGTTCGA 
GTGGGAGCAT GCAGAGTGTT AGGTGCTTTG CAACATTGTC ACTCACAAGT CGCCACAATC 
GTGCGCGGAC TCTTAGACTC GGCGGATACT AAATTTTTCA TACACAAGGA CGCCCTGCAG 
TGTCTTGAAC ATCCCGAGGC GCTTGAGAAG GAATTCGGGA ACGACGCGCG ATAG

Protein sequence

MEALQQRERM AVLSGLVKAA DDAFDRAEID DVTKELFLDT QIEDEMKEMF DIARRIQFFD 
ETGKLEGALE LVKDFEKYAR SEDSKVVAVA VWCGAWSAIQ NELFRRSEWI RVLEKLFWTI 
HTLCLSHRFS KIRACAAIQC GELATAAMLK LCDLRVHEAY ARDMLRLSLD EKCTVRHAVS 
CSVSMCFVRR IYSGLFTVRE ADAALLCAMF VSAVGKRNPF AHIDYVNKAH LTKTMNEGFA 
SVTHYTLERM IQCMLNDQLW RTDDKDILGR RLRACALIVE HVGDRVAPFV DSIIKMLLDT 
LTKSLVWRDA EYLMEILMIH APSTRRTWVE PTMLHVNSEF TLHMVALCVC EKFLSRRKQH 
GVTHALNLDD VAFISESLEK TMFRLDSCDK LDDSSGVLNC VESILASCLE ILRQQNKASM 
ATRKFKKLEA CVKIQTMYFC VCGMSSIDVT GEMLMACTPK DEVEASEIFR LIVDRNVPLR 
SFRANTLTAL FCLLRGTQLV AEISECLAQQ IDPATCDASL DSLLTVKDFM VPFILYLRSR 
GDETLNKADF VTNIAPVLDA LLDWMRWRPG EMTAQLADIA ATCFAVQNSL SEPISYNDEI 
GEFVESLTDE QSEESALQTF LTRWLSLENR SKRVIDVICS MSFEKTSSVF CRQKRDAMLH 
LQKCACLADR QNAVKFLERV ASRYLEQVST SSSTQVRVRS LLALGKTIAQ LIRDFNDHQT 
AKKFVGDIFV FADDADKAVR VGACRVLGAL QHCHSQVATI VRGLLDSADT KFFIHKDALQ 
CLEHPEALEK EFGNDAR