Gene OSTLU_49687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_49687
Symbol
ID	5002143
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009359
Strand	-
Start bp	596753
End bp	597991
Gene Length	1239 bp
Protein Length	369 aa
Translation table
GC content	55%
IMG OID	640417564
Product	predicted protein
Protein accession	XP_001418058
Protein GI	145347191
COG category	[R] General function prediction only
COG ID	[COG0820] Predicted Fe-S-cluster redox enzyme
TIGRFAM ID	[TIGR00048] radical SAM enzyme, Cfr family

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.622489
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGCGG CCACCGCGCG CGCCGTCGCG AAGGATTTGC TCGGAATGTC CGCGCGCGCG 
CTTAAATCGA TCGTCGTCGA CGAGTGCGGG CAACCTTTGT ATCGAGCGAC GCAGATTCGC 
GAACACCTGT ACGGCGCGCG GCGGTGTCGA AGGATTGAAG ATTTCTCGCT GATACCGCGT 
GAAATGCGGG ACGCGCTCGT CGCGGGGGGG TATCGAACCG GAAGATTGGC GGTGGAGTCG 
GCGAGCGTGA GTGGGTGCGG CACTGGGAAG GTCTCCTTGC GCGTGGGCGA GCGAGAGGTG 
ATCGAGGCGG TGGGGATTCC AGACGCGAGT TGTTGGCGCG CGAGCGCGGA GGCTGAGGTG 
GAGGTAGAGA ACGCATCTGA GGTGTTCAAA AGCGTGCAGG GATGGGATAA GAATCGGTTG 
ACGGCGTGTG TGAGCAGTCA AGTCGGATGC GCGATGAAGT GCACGTTTTG CGCGACAGGG 
ATGCAAGGAT ACAAGCGAAA TTTGACGCCG GCGGAAATCA CGGCTCAGGT GATCGAACTC 
GAGGAGCTGT ACGGTAAACG CGTCTCGCAG GTGGTCTTTA TGGGCATGGG TGAACCGATG 
CTGAATATCA AATCCGTGGT TCAAGCGATA AGGTGCCTGA ACGAAGATGT TGGGATTGGT 
GGACGGCACA TAACAGTTTC AACCGTTGGC ATCCCGAATT CGTTGAAGAA ACTGGCGAAG 
GAAAAGCTCG CAATCACGCT TGCAATCTCT TTGCACGCCC CTGATCAACA CACGCGGGCA 
AAAATAGTGC CATCCGCGAA GTACTATCCA ATGGAGGACT TATTGAATGA CGCACGCGCT 
TACTTTAAGG AGACAGGGAG ACGCGTGACG TTCGAGTACA CCTTGCTCGC CGGCGTCAAC 
GATTCCCCAT CTCAAGCAAA AGCGCTGAGC CGAATGTTAA AACGGAAGTT TGGTACCGGC 
GCACACGTCA ACATCATTCC TTGGAATAAC ATCGATGGTA TTAATCACAC AAGGCCATCC 
GGAAACGCCA TTCATCGATT CTGTGCGCAG TTAGAGGGCG GTGTGACGCA TACCATACGA 
CGCACGCGTG GCTTGGACAC AAACGCCGCA TGCGGAATGC TCACTGGAGC GTTCGAAAGA 
CGAACGCTTC GTGCCAACGC GTGAGCATAC AGCAAAAAAA AGATGTACAG GATGTACGGT 
AACGCTAGTA ACTGTAGCCT ATATTCTAGA AAAGTCTAG

Protein sequence

MAAATARAVA KDLLGMSARA LKSIVVDECG QPLYRATQIR EHLYGARRCR RIEDFSLIPR 
EMRDALVAGG YRTGRLAVES ASVSGCGTGK VSLRVGEREV IEAVGIPDAS CWRASAEAEN 
RLTACVSSQV GCAMKCTFCA TGMQGYKRNL TPAEITAQVI ELEELYGKRV SQVVFMGMGE 
PMLNIKSVVQ AIRCLNEDVG IGGRHITVST VGIPNSLKKL AKEKLAITLA ISLHAPDQHT 
RAKIVPSAKY YPMEDLLNDA RAYFKETGRR VTFEYTLLAG VNDSPSQAKA LSRMLKRKFG 
TGAHVNIIPW NNIDGINHTR PSGNAIHRFC AQLEGGVTHT IRRTRGLDTN AACGMLTGAF 
ERRTLRANA