Gene OSTLU_3554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_3554
Symbol
ID	5004057
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009364
Strand	+
Start bp	172860
End bp	174087
Gene Length	1228 bp
Protein Length	375 aa
Translation table
GC content	57%
IMG OID	640419478
Product	predicted protein
Protein accession	XP_001419925
Protein GI	145351102
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.298587
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.425378
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GACGAGCGAG ACTTGAAGAC GCCGGATAAT TGGGTGAAGA GGCATCCGTG CGTGCGAGAC 
GCGAGGCGAC GCGAACGCGG GACGACGAGG ACGCGGCGAA CGACGACGGC GCGCGTGACT 
GACGGTGGTT TGCGTCGATC GTGGTGATAG GAATTTGATT CGTCTGACCG GGAAACACCC 
GTTTAACGTC GAGGCGTCGC TTCCGGAGTT GTATGATTAC GGATTCATCT CGCCGGTGAA 
CTTGCACATC GTGCGGAATC ACGGCGCGGT GCCGAAGTGC GATTGGGACA CGCACAAGAT 
TAACATTTGT GGCAACGTCC CGAAACCGTT CGAGATCGGT ATGGACGAGT TGGTGAAAAT 
GCCGAGCGAC ACGTTCCCGT GCTTGGTGGT GTGCGCGGGG AACCGTCGGA AGGAACAAAA 
CTTGGTCAAG TCGTCGATTG GGTTCTCGTG GGGGCCGTGC GCCATCGGAA ACACGTACTG 
GACGGGCGTA CCGCTGCGAG TGTTGCTCAA CAGAGCGGGC ATTCATAAGC CCGGTCCGGG 
TGCGCGATAC GTGTGCTTGG CTGGTCCGCA AAACGAATTG CCGAAGGACT ACCCCGATCA 
AGACGGTGGT CCGGGATCGT ACGGCACATC CATCGACATG GAAACCGCGC TCGATCCGAC 
GTGCGATGTC ATTGTGGCGT ACGAACAAAA CGGTGCCAAG CTTCACCCAG ACCATGGATT 
CCCAGTGCGG GTGATCATTC CCGGTTACAT CGGTGGGCGC ATGATAAAGT TTTTGAAGGA 
GATTAAAGTC ACCGACAGAG AGTCAAACAA CTTTTATCAC TTCAACGATA ACCGCGTGTT 
ACCGCCGCCA GTTGACGCTG AGCGCGCGAC CGAGGAGGGA TGGTGGTTCA AGCCCGAGTT 
CATCATCAAC CAACTCAACA TTAACGGTGC CATCGCGTAC CCGGCGCCCG AAGAAGTCAT 
TCCCAAGTCG CAAAAGACGT ACGCCTTCAA AGGTTACGCC TACTCTGGCG GCGGTCGCAA 
GGTCATTCGC GCCGAGCTTT CCTTCGATCA AGGCTTGAGC TGGGAATTGA GTGATATTCA 
CACTCGCGAA GAACCGCGAT GGGCCGATTT CAGCTCCGGT GACAAGGCCA GGCACTGGTG 
CTGGTGCATG TGGACTCTCG AAGTGCCGAT TGAGAAGCTC CTCGACAAAA AGTGCGTCGA 
AGTGTGCTTC CGCGCCGTCG ATCAATCC

Protein sequence

DERDLKTPDN WVKRHPNLIR LTGKHPFNVE ASLPELYDYG FISPVNLHIV RNHGAVPKCD 
WDTHKINICG NVPKPFEIGM DELVKMPSDT FPCLVVCAGN RRKEQNLVKS SIGFSWGPCA 
IGNTYWTGVP LRVLLNRAGI HKPGPGARYV CLAGPQNELP KDYPDQDGGP GSYGTSIDME 
TALDPTCDVI VAYEQNGAKL HPDHGFPVRV IIPGYIGGRM IKFLKEIKVT DRESNNFYHF 
NDNRVLPPPV DAERATEEGW WFKPEFIINQ LNINGAIAYP APEEVIPKSQ KTYAFKGYAY 
SGGGRKVIRA ELSFDQGLSW ELSDIHTREE PRWADFSSGD KARHWCWCMW TLEVPIEKLL 
DKKCVEVCFR AVDQS