Gene OSTLU_51237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_51237
Symbol
ID	5005059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009367
Strand	-
Start bp	20698
End bp	21846
Gene Length	1149 bp
Protein Length	360 aa
Translation table
GC content	68%
IMG OID	640420480
Product	predicted protein
Protein accession	XP_001421029
Protein GI	145353457
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	0.587591
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TCGCGTCGAT GCGCCCTCGC GTCGCGTCGC GATCGACGCG TCGCGATCGA CGCGCGTCGA 
GCGCGCGCGC GTCGCCGACG GCGCCTAACG TGCGGACGAT CCTCGGGACG ATGACGTTCG 
GGTGGCGACA CGCGAGCGAA GCGTGCGACG ACGACGCGAG CGCGCGAATG CTGGACGCGT 
TCGCGCGCGC CGGGCACGAC GAGATCGACA CCGCGATCGC GTACGCGAAC GGGGAGACGG 
AGCGAATCCT CGGACGCGTC GACGCGGGAC GGCGCGCGCG CGTCGACACG AAGGCGAATC 
CGTGGCCGGG CGGGACGATG ACGCCGAGCG CGGGACGAGG GGGGTTAGGG GCGAACGAAC 
TGCGGGCGCA GGTGCGACGG AGCGTGGAAT CGCTGCGAGG GACGAAGATT CGAACGCTGT 
ATTTACACGC GCCGGACGCG GACACGACGC TGGAGGAGGC GCTGCGAGAG TGCGAACGGC 
TGCGCGTCGA GGAGCGCGCG TTCGAAGACG TGGGACTGTC GAATTTTTCG GCGTGGGAGA 
CGGTCAAGGC GCACGAGCTG TGCGAAAAGT ACGGGTGGAA GAGACCGACG ATTTATCAGG 
GGATGTACAA CGCGCTGACG CGAAACGTCG AGGCGGAGTT GGTGCCGGCG CTGCGGGCGA 
CGAAGATGCG CTTCGCGGCG TACAATCCCC TCTGCGGAGG GTTGTTGACG GGGAAATACA 
AGGGCAACAC CGACGTCGGC GCGGTGTCCG GCGGGCGATT CGCCGGGAAC GACATGTATC 
AGTCTCGATT TTGGTTGCCG TGCTATCACG AAGCCGTGGC CGAGGTGGTG GAGGCGTGCG 
AGAAGCGCGG CGTCGCGCCC GCGGACGCCT CGCTGCGATG GCTCTACCGG CACTCCGCGT 
TGGACGGCGC CGAGGGCGAC GCCGTCATCG TCGGCGCGTC GAGCGCGGCG CAGCTCGAGG 
CGAATTTAGC GAGCGCCGCG CGCGAAGAGC CGCTGCACCG GGACATTCTC GACGCCTTCG 
ACGCGGGTTG GGAAAAGTGT CGCGCGTCCG CCGCGCCGTA CTTTCGCGGC CACTGTAAAA 
TCGCGCGTTG AAGTCATCAT CAAGTCACTC ATCGCAGTCA CCATCGTCGC GCCGTACTTT 
CGCGGCCAC

Protein sequence

MRPRVASRST RRDRRASSAR ASPTAPNVRT ILGTMTFGWR HASEACDDDA SARMLDAFAR 
AGHDEIDTAI AYANGETERI LGRVDAGRRA RVDTKANPWP GGTMTPSAGR GGLGANELRA 
QVRRSVESLR GTKIRTLYLH APDADTTLEE ALRECERLRV EERAFEDVGL SNFSAWETVK 
AHELCEKYGW KRPTIYQGMY NALTRNVEAE LVPALRATKM RFAAYNPLCG GLLTGKYKGN 
TDVGAVSGGR FAGNDMYQSR FWLPCYHEAV AEVVEACEKR GVAPADASLR WLYRHSALDG 
AEGDAVIVGA SSAAQLEANL ASAAREEPLH RDILDAFDAG WEKCRASAAP YFRGHCKIAR