Gene OSTLU_26228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_26228
Symbol
ID	5004099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009364
Strand	+
Start bp	455971
End bp	457977
Gene Length	2007 bp
Protein Length	668 aa
Translation table
GC content	63%
IMG OID	640419520
Product	predicted protein
Protein accession	XP_001420009
Protein GI	145351277
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.281249
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.273766
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCCG CGTCGACGCT CCGCACCGCG TCGACGCGCG AACGCGCATC GACCCGACGC 
GTCCCGGCGC GCGCGCGCGC GCTTCCGTCG TCGTCCTCGC CCCGCCGCCG ACGCTTATCC 
ATTACGACGT CACCGGGATT ACGTCTCGAC GCCGCGTCGC CGCGCGCGCC GACGCGCGCG 
CGCGCGGCGT CGGACGTCGT CGAATCGTCC TCCGCGCCGC TCGATCCGAT CGGGCTGAAC 
CCCGATCGCG CCGCCGTGGT GAACGCCGAC CCCGACGCGT ACTCGTGGAC GAAGCAGTGG 
TACCCGGTGG CGGTGGTGGA CGTGCTGGAC GAGACGAAAC CGCACCCGAC GACGCTGCTC 
GGGATAGATT TGGTGGTTTG GAAAAATGGT GATGGGTCGT GGAGCGTGTT CGAGGATAAG 
TGTCCGCACA GGTTGGCGCC GCTGAGCGAG GGACGGGTGG AGAGCGACGG GACGCTGCTG 
TGCGCGTATC ACGCGTGGCG ATTCGACGGC GACGGAAAGT GTACGTCGAT GCCGCAAGCG 
TCGAGCGCGG AGGAAGAAGA AAGAATCAAG GCGAACGTGC GATCGTGCGC GTTCAAGCGA 
CCGAGCATGG TGGCGCAAGG GTTGGTGTGG GCGTGGGGCG AAGGCGGGAA GGATGCGGAG 
ATGGAAGCCG CGATGACGCC GCCGTTGTTC GTGCCTGAAA TAGAGGGCAT CGGTAAGAGT 
GGTCGCGCGA GCTGCGGTGG GTTCAGAAAT CACTGGCAAG TGCGCGATTT ACCGTACGGT 
TGGAACGCGT TCTTCGAAAA CGCCATAGAT CCCGCGCACG CCGTCGTGAG TCACCACACG 
TTGGTCGGTT CGCGATACGA CGACCCAGCC GGGTTTCAGT GCGTCGTCGA GCGTCCGGTG 
ACCGACGCCG GTGGGTTCCG ATGCGCCATC GACCCGGCGG TGCCACCGTT CAACTCGATC 
GGGAAATACG ACGCGGAGAC GTCTTACGAC TTCCAGCCGC CCGCGCTGTT GAAGATTGAC 
TGGCGACACG AGGGGGGGCG ATTTTTGACG TCGCACTACT GCGTGCCGAC GCGTCCGGGG 
TGGTGCCGCC ACTTCGTCGT CACCATCGCG CAGCGACGAC CCGAAATGGG GAACAAAATT 
CGCGAGCACC GATGGTTCAA GCTAAACCTG TTCACGCTCA CGTCGCCCGC GTGGCTGACG 
CACGTGTTGG GGCCGACGTT TTTGCATCAA GACATGGTGT TGTTGCACCA ACAAGAAAAA 
ATCATCGCTC AGGGCGACGG ACAGGCGATG GCGCAAAAGT GGAAGGATCA AGTCTTCACG 
CCGAGCACGG CGGATAAGAT GACCATCTTC TTTTACAAGT GGTTCGAGAA GAATGGCCCG 
ATTCCGTGGG CGCCCGGGAC GGAGCAAATG CCGCCCATCG AGCGCGATTC GAGCAAGCTC 
TTCGACACGT ACGAGATGCA CACCAAGTAC TGCACGCACT GCCAAGGCGC GCTTCGCAAC 
ACGGAGATCG GGATGTGGGC TACGGGCGCG ATCGCGGGGG CGAAGTTGTT TTGGGTCGGC 
GCGAGTGTCG TCTTCACCGC GGCGTTGCTC GGCAGCGGCG ACGACGCGTC GTCGTCGCTC 
GACGTGTTCG AGTTAGCGAG CGCCGTCGAC GGTTCGGTGT ACGGTGACTT TTTCAGCGCT 
TTGAGCTTGG GCGCGACGTC ATTCTTTCTG TGGGGTTTCG CGCAAATGTT TCGCACGTAC 
CCGTTTTCGC ACTCTGAGGA CGACATCGTC ATGGAGGGTA CGGCGAAAAT CGGTTTGTCC 
AACGACGGAC CGAGCGCGTA CATCGATTTC GTAGATTCGA CGCTGTTCAA GGAAAAAGGT 
GGCGATCACA ACCGCGGTTG CGAGTGCAGC ACGTGCTCGC CGCATTTCAA GGATTTGATC 
AAGAGCACCA TGTTGGCGCG CGCGAAAAAG TCACCCGCCG TCGTCGAGGA GGCGGAGGAA 
GAGCGATCGA TCCCGGTCGC GCGATGA

Protein sequence

MTAASTLRTA STRERASTRR VPARARALPS SSSPRRRRLS ITTSPGLRLD AASPRAPTRA 
RAASDVVESS SAPLDPIGLN PDRAAVVNAD PDAYSWTKQW YPVAVVDVLD ETKPHPTTLL 
GIDLVVWKNG DGSWSVFEDK CPHRLAPLSE GRVESDGTLL CAYHAWRFDG DGKCTSMPQA 
SSAEEEERIK ANVRSCAFKR PSMVAQGLVW AWGEGGKDAE MEAAMTPPLF VPEIEGIGKS 
GRASCGGFRN HWQVRDLPYG WNAFFENAID PAHAVVSHHT LVGSRYDDPA GFQCVVERPV 
TDAGGFRCAI DPAVPPFNSI GKYDAETSYD FQPPALLKID WRHEGGRFLT SHYCVPTRPG 
WCRHFVVTIA QRRPEMGNKI REHRWFKLNL FTLTSPAWLT HVLGPTFLHQ DMVLLHQQEK 
IIAQGDGQAM AQKWKDQVFT PSTADKMTIF FYKWFEKNGP IPWAPGTEQM PPIERDSSKL 
FDTYEMHTKY CTHCQGALRN TEIGMWATGA IAGAKLFWVG ASVVFTAALL GSGDDASSSL 
DVFELASAVD GSVYGDFFSA LSLGATSFFL WGFAQMFRTY PFSHSEDDIV MEGTAKIGLS 
NDGPSAYIDF VDSTLFKEKG GDHNRGCECS TCSPHFKDLI KSTMLARAKK SPAVVEEAEE 
ERSIPVAR