Gene OSTLU_34867 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_34867
Symbol
ID	5003729
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	-
Start bp	155396
End bp	157444
Gene Length	2049 bp
Protein Length	652 aa
Translation table
GC content	55%
IMG OID	640419150
Product	predicted protein
Protein accession	XP_001419728
Protein GI	145350681
COG category	[S] Function unknown
COG ID	[COG0585] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00094] tRNA pseudouridine synthase, TruD family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.437532
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCACG CGCCGTCGTC GGCATCGTGG CGCGAGAACG ACGCGATCGA GCACGTGGAG 
GAGCGACTCG TCGGCCTCGA GCTCTACGCC AACGCCGCCG CCGGATTCGA TGGTGTGCTG 
AAAGAACGCT ACAGCGATTT CATCGTGCGG GAGATCGACA TCGAGAGCGG TGAGGCGGTG 
GTTTTGAATG AACTGAGCGC GACGTGCGAT GTAGAGATCG ACGCGCGAGA GCGGAAGAAG 
TTTGAGGCGA TGAAGGCGAA AGTGCAAGCC ATGGAACGCG AGCGCGGGCC GGACGACGAA 
GCGGAGGACG AGGACGCGGC GAAGGATGAC GTGGAGGGGG ATAAAGAAGA GAGTATTGAG 
GAGGCAATGA AAGAATTCGA AGCGCTGTGC GGTGCAGAGG ACGCGCGGCG ACTGAGAGAA 
TTTTTAGCCA CTCCCGGGGT GACGCGTCGA AGTCAGAAGA CGCACGATGG AAAGGCGGAA 
ACGCCCCAAC CGCTCGTGCT CGAGCCGACG ACGGATAAAG CGAAACGGAC GCAAATTCAT 
CAATTTTTCA AGAAACACTT TTTATTACCT ACGGACAACG TCGTGGAGTC GAACGAGGAA 
GAGAAGGAAG CTCTCAAGAA CTTGAAAAAG CCGTCTTCGA GCGTGCGCGT GCATGCCGCC 
GTCAAGCAAG GCAAGAAGCG AACGCGCGTG GAGGCAATGG ATCATCGAGC GGTGGGAAAC 
TTTTGGCCCG AAGGCGTTCC AGAACATGTG CGATTTGCGT TTTGCAAAGA AAACAAAGAG 
TCTTACGAGA TGCTCAACGT CATAGCCCGG GCCTTGAAGG TGAACTTCAA GTCTATTGGC 
GTCGCCGGAA CGAAGGACAA GCGCGGAGTG ACAACGCAAC ACGTCACCGT GCACAGAGTT 
CGGGCGAAAA GGTTGGCCAA GCTGGTACTT TATGGGTGTA AAATTGGTAA CTATACGTAT 
GTCGACAGAC AACTTGGTTT CGGAGACCAT TGCGGGAACG AGTTTGAGAT AACGCTCCGA 
GGCATCGACC CAGACGTCGT CGGGAACGTG GAGGAGGCAG TGCGCGCACT CAAGTCTTCA 
GGGACCATCA ACTACTACGG TTTGCAGAGA TTTGGTAGCG CTGGGGGCAA ACACGCAACG 
CATAAAATTG GAATTGAACT TTTACGTGGC GAATGGCAAG CTGCGATCGA CGCTTTGCTG 
CTGCCGCGCG AAGGCGAGCG CGACGATGTC ATGAAGGCGC GCTTGAAATG GATGGAAACA 
AAGGATCCCA ATGAGACTTT GAAGTTGATG CCACGCTGGT GCGCGGCAGA GCGCTGTGTG 
CTCGAGCGCA TGTCAAAAGT TCGCTCCACG GACTTGGTCG GATCGCTGTT GGCCGTGCCG 
AAGCAGATTA GACTGATGTA CATTCACGCC TACCAGGCAT ACTTGTTTAA TCGTGTCGTG 
TCGGAGCGCA TTCGTAAGTA CGGAGTCAAC ACGGTCGTCG AAGGTGACTT AGTGCTCGAA 
GAGGGAAACT GTGCCGGAGA TGAAGGCGAA GACGATATGA ATGGCGATAC TCGGGTGAGT 
ATGCCGAGGG TTCGCGTAGT GACAGCCGAG GAAGCCGCTT TGGGTGCGAT TGACTCGTCG 
CTCGTGGTGC TGCCGCTTCC TGGAAACTCG ATAACGTACC CAACAAATTT GGGTGATGTT 
TACGATCGAT TCGCCGCGGA GGATGGAATC AGTTTGAATA CTACGACGCA TTCGGTTCGT 
GAATTCGCAA TCAACTCATT CACCGGTGAC TACCGTAGAT GCTTTCTCAA ACCCACAAAC 
GTATCGCACA CCGTCATTTC GTACGCGGAC GCGGCGGCGG ATTTGGTTTT GACCGATCTC 
GATCGCATCA ATGGCATCAC CGAACGCACC ATCGAAGACG GCCCTTTACG TGCCGTAACG 
GTGAAGTTCA CTCTGCCCCC GTCTTCTTAC GCCACCATGG TTCTTCGGGA GTTGATGAAG 
GCGAACACCT CGGTGAGCTC GCACAAGCGC AAGACGCTCG ACGCGCGAGC GGCGGCTTCC 
GTAGAGTAG

Protein sequence

MSHAPSSASW RENDAIEHVE ERLVGLELYA NAAAGFDGVL KERYSDFIVR EIDIESGEAV 
VLNELSATCD VEIDARERKK FEAMKAKSIE EAMKEFEALC GAEDARRLRE FLATPGVTRR 
SQKTHDGKAE TPQPLVLEPT TDKAKRTQIH QFFKKHFLLP TDNVVESNEE EKEALKNLKK 
PSSSVRVHAA VKQGKKRTRV EAMDHRAVGN FWPEGVPEHV RFAFCKENKE SYEMLNVIAR 
ALKVNFKSIG VAGTKDKRGV TTQHVTVHRV RAKRLAKLVL YGCKIGNYTY VDRQLGFGDH 
CGNEFEITLR GIDPDVVGNV EEAVRALKSS GTINYYGLQR FGSAGGKHAT HKIGIELLRG 
EWQAAIDALL LPREGERDDV MKARLKWMET KDPNETLKLM PRWCAAERCV LERMSKVRST 
DLVGSLLAVP KQIRLMYIHA YQAYLFNRVV SERIRKYGVN TVVEGDLVLE EGNCAGDEGE 
DDMNGDTRVS MPRVRVVTAE EAALGAIDSS LVVLPLPGNS ITYPTNLGDV YDRFAAEDGI 
SLNTTTHSVR EFAINSFTGD YRRCFLKPTN VSHTVISYAD AAADLVLTDL DRINGITERT 
IEDGPLRAVT VKFTLPPSSY ATMVLRELMK ANTSVSSHKR KTLDARAAAS VE