Gene OSTLU_38397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_38397
Symbol
ID	5002109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009359
Strand	-
Start bp	507413
End bp	508387
Gene Length	975 bp
Protein Length	324 aa
Translation table
GC content	60%
IMG OID	640417530
Product	predicted protein
Protein accession	XP_001418029
Protein GI	145347128
COG category	[R] General function prediction only
COG ID	[COG0300] Short-chain dehydrogenases of various substrate specificities
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.504345
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00204259
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCGCGAT GTTGGTGGCC TATCGGCCAC TTGCGAGGAT GGCTCGGACC TTCGGGCTTC 
GGCTCCAAAT CGTCCTGGCG CGACGTCATC GCGGACCTCG ACCCTGGATC TGCCAGCCGA 
AATTGCGTTC TCATAACCGG CGCCACGGCT GGCATAGGCT TCGAGACGCT CAAAGCATTT 
TGTAGCACGG GTGCGACGGT AGTGGTCGGT GCGCGTGACG AAGCGCGAGC AAAGGCGCTC 
GCGTGCGAGC TCATGTCTAA GACGACGTCC ATCGTTCGCG TCCTTCGTCT CGACTTGTCG 
TGTTCAAAGT CGGTTCACGC CTTTGTTGAC GCATTTCTCG CGCTCAATCT CAAGCTCACC 
GTCCTCGTGA ACAACGCTGG TATAATGCCT TGTCCGTTTG ACGCAGATTC ACACCGAGAC 
CTCGCGTTTC ACGTGAAGTT TCTCAACCAC TTTGTTTTAA CGCAGTTGCT CCTGGAATCG 
TTTGATCCGG CGGGCGCGCG CGTGGTGAAC GTCACCAGCG AAGTCTATCG CTTCTCTTAT 
CCGGAAGGTA TTCGGTTCGG CAAAATAGAC GACGACCGAG CGTACGACAG CGTGAAATCC 
TACGCCCAAT CGAAACTCGC GCTGCTCTTG TGGACTCGGT ACCAAGGCGA AGCGCTTCGC 
GAGCGCGGCG TGCAATTTTT CGCCGTGCAT CCGGGCTCGG TCGCCACGCA AGGCAGCGCG 
CGCGCGCGAA AATCCAGCGG TTGGCGCGGA GCCTTGCTCC ACTGCGTCGG CGCACCGTTC 
GTCAAATCCG TCGAGTGCGG CGCGGCGACG ACGATTTATT GCGCGCTTCA TCCCGGCGCG 
TCGATGTACA ACAGATTCGG CGAGTATTAT TTCGCGTCGT GCAATCCGAG AGGCGTGCGC 
GAGATTTCGC GCGACGCAAC GCTCGCTCGA CGTCTCGTCG AGTACGCCGC GCGCGAGCTC 
GACGCGAGCG CGTGA

Protein sequence

MPRCWWPIGH LRGWLGPSGF GSKSSWRDVI ADLDPGSASR NCVLITGATA GIGFETLKAF 
CSTGATVVVG ARDEARAKAL ACELMSKTTS IVRVLRLDLS CSKSVHAFVD AFLALNLKLT 
VLVNNAGIMP CPFDADSHRD LAFHVKFLNH FVLTQLLLES FDPAGARVVN VTSEVYRFSY 
PEGIRFGKID DDRAYDSVKS YAQSKLALLL WTRYQGEALR ERGVQFFAVH PGSVATQGSA 
RARKSSGWRG ALLHCVGAPF VKSVECGAAT TIYCALHPGA SMYNRFGEYY FASCNPRGVR 
EISRDATLAR RLVEYAAREL DASA