Gene OSTLU_29975 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_29975
Symbol
ID	5000536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009356
Strand	+
Start bp	308075
End bp	309166
Gene Length	1092 bp
Protein Length	346 aa
Translation table
GC content	64%
IMG OID	640415957
Product	predicted protein
Protein accession	XP_001416125
Protein GI	145342084
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.448266
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGTTCGCATC GCATCGCGAC GCATCGGATG GCGCGACGCG CGCGCCTGCG CACGCGGCTC 
ACCGATCTCG TTCCCGGACT CGAGCATCCC GTGACGCAGG GCGGCATGCA CCACGTCGCG 
TACGCCGCGC TCGTCGCCGC GGTGTCGAAC GCCGGCGCGC TCGGCACGCT CACGGCGCTG 
ACGCAGCCGA CGCCCGAGGA TCTGCGACGA GAGATCGCGC GAACGCGCGC GATGATCACG 
CGGAGGAGCG AAAAGAGTAA GAGCGGATAC GCGCCGTTCG CGGTGAACTT CACGCTGCTG 
CCGGCGCTGC GACCGCCGGA TTACGAATCG TACGCGAGGG TGATTTGCGA GAGCGACGTC 
GAGGTGGTGG AGACGGCGGG AGCGAATCCG GGGAAATTCA TCGAGATGTT CAAGAAAAAG 
GGGATAATAG TGATACATAA GTGCACGACG CTGCGACACG CGCTGGCGGC GGAGCGGTTG 
GGGGTGGACG CGGTGAGCGT GGACGGGTTC GAGTGCGCGG GACATCCGGG GACGAACGAC 
GTGGGGGCGA TGGTTTTGTT GGCCAAGGCG CGAGACGTGC TGACGGTACC GTTTCTAGCG 
TGCGGGGGGA TAGGAACTGG GAGGCAACTC GCGGCGGCGC TGGCTTTGGG CGCGGATGGG 
GTGTGCATGG GGACGAGATT TATGGCGACG CGCGAGGCGC CGATTAAGGA TGGCATCAAA 
CGCGCGTTAA TCGCCGCCGA CGAGAACCAA ACCACGCTCG TCATGACGAC GGTGAAGAAT 
CACGAGCGGG TGTATAAGAA TAAAGTCGCC GAAGAAGTGC GCGCGATCGA GGCGGTGAAG 
CCCGGAGACT TTGGCGCGAT TCACCATTTA GTGCGCGGGG AAAACTATCG CGTATCGTTT 
CAGGAAACCG GCGACGCCGA ATCGAGCGTC TGGAGCGCCG GATGCGTCAT GGGTCTCATC 
GACGACGCCC CATCGTGCGA CGAACTCCTC ACGCGCATCA TCGACGAGGC TGTGGACGTG 
ATGACGACGC GACTACATCG CATGATTGTC GTAGACGCCG CGCTCTGAGC CGCGTTTCGC 
CGTAGAAGCT CC

Protein sequence

MARRARLRTR LTDLVPGLEH PVTQGGMHHV AYAALVAAVS NAGALGTLTA LTQPTPEDLR 
REIARTRAMI TRRSEKSKSG YAPFAVNFTL LPALRPPDYE SYARVICESD VEVVETAGAN 
PGKFIEMFKK KGIIVIHKCT TLRHALAAER LGVDAVSVDG FECAGHPGTN DVGAMVLLAK 
ARDVLTVPFL ACGGIGTGRQ LAAALALGAD GVCMGTRFMA TREAPIKDGI KRALIAADEN 
QTTLVMTTVK NHERVYKNKV AEEVRAIEAV KPGDFGAIHH LVRGENYRVS FQETGDAESS 
VWSAGCVMGL IDDAPSCDEL LTRIIDEAVD VMTTRLHRMI VVDAAL