Gene OSTLU_30642 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_30642
Symbol
ID	5000783
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	+
Start bp	513738
End bp	515128
Gene Length	1391 bp
Protein Length	368 aa
Translation table
GC content	64%
IMG OID	640416204
Product	predicted protein
Protein accession	XP_001416682
Protein GI	145344318
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0408] Coproporphyrinogen III oxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.00137682
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0422052
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGCGACACGC GGATCGGATC GCGCGCGCGC CCGACGGTCG TCCGACGACG CGCGAACGAG 
GACGACGCGC GACGCGCGAG ACCGCGATCG AACGAGGACG CGCGAAGGAT GCGCGCGGCG 
ACGACGACGA CGCCGATGTC GCGGGCGATG CGGGCAACCG GTGTGGATAA ACCTCGCGCG 
GTGCGGGCGT CCGCGGTGCG GGCGCGAGCG ACGCGGGGAG GCGCGACGCG CGCGCGGGCG 
GCGGCGCAAG GGATCGAACA GGAGGTGAAG ATCGACGCGG CGCCGACGAC GCTGCTGAGA 
GAGGGATCGG GCGAGGAGGG GGACGCGACG CAGATGCGGG CGAGGTTTGA GAAGATGATT 
CGCGCGGCGC AAAATGAGAT TTGCGACGCG ATCACGGCGT TGGATGGGAA GCCGTTTCAC 
GAGGACGCGT GGACGCGACC GGGTGGTGGT GGTGGGATCT CGCGCGTGTT GCAAGATGGG 
AACGTGTTCG AAAAGGCTGG CGTGAACGTG TCGGTGGTGT ACGGACAGAT GCCGCCCGAG 
GCGTATCGGG CGGCGACGGG GGAGGAAGGC GCGTCTAAGG AGATGATTCC GTTCTTCGCG 
GCGGGTATTT CGAGTGTTAT GCACCCGCAT AATCCGATGG CGCCGACCGT TCACTTCAAC 
TACCGTTATT TCGAGACGGA TGCCCCCAAG GGCTCCGCGG GCGCGCCGCG CGCGTGGTGG 
TTTGGCGGCG GCACGGATTT GACGCCGTCG TACATTTTCG ACGAAGACGT CACGCACTTC 
CACCAAACTT TGAAGGATAT CTGCGATAAG CACGATGGCG AGTTTTACCC GAAGTTCAAG 
CAATGGGCGG ATGATTATTT CATGATCAAG CACCGCGGCG AACGTCGCGG CGTCGGCGGC 
GTCTTCTTTG ACGACATGAA CGACCGCAGC AAGGATGAAC TCCTCGCGTT CGCGACGGAC 
ATGGCGGGCG GTGTCGTCCC GGCGTACGTC CCGCTCGTCG CCAAGCACAA GGACGATGAG 
TTCACGCCCG AACAACGCGC CTGGCAACAA ATGCGCCGCG GTCGCTACGT CGAGTTCAAC 
CTCGTGTACG ACCGCGGGAC GACGTTCGGT TTGAAAACCG GCGGTCGCAT CGAATCCATC 
CTCATGTCTC TCCCGCGCTA CTGCGAGTGG CAATACGACC ACGCGCCCGA AGCCGGTTCT 
CGCGAGGCCG ACGCGCTCGA CGCTTTCAAG AACCCGAGAA CGTGGTGCGC GTAAGCGCGC 
CTCGTCCCTC GAGCGCGTGC TCTCTTAGTT TCGCCTCGTT CCGTCGTCGC GTCGACGCGC 
GTCGACGCGC CGCCTGCCGA GGCCCCTTTA CGCACCATTC AATCATTCAA ACGACGAAGA 
TTCGAGTTTT A

Protein sequence

MRATGVDKPR AVRASAVRAR ATRGGATRAR AAAQGIEQEV KIDAAPTTLL REGSGEEGDA 
TQMRARFEKM IRAAQNEICD AITALDGKPF HEDAWTRPGG GGGISRVLQD GNVFEKAGVN 
VSVVYGQMPP EAYRAATGEE GASKEMIPFF AAGISSVMHP HNPMAPTVHF NYRYFETDAP 
KGSAGAPRAW WFGGGTDLTP SYIFDEDVTH FHQTLKDICD KHDGEFYPKF KQWADDYFMI 
KHRGERRGVG GVFFDDMNDR SKDELLAFAT DMAGGVVPAY VPLVAKHKDD EFTPEQRAWQ 
QMRRGRYVEF NLVYDRGTTF GLKTGGRIES ILMSLPRYCE WQYDHAPEAG SREADALDAF 
KNPRTWCA