Gene OSTLU_31566 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_31566
Symbol
ID	5002043
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009359
Strand	+
Start bp	146867
End bp	147797
Gene Length	931 bp
Protein Length	275 aa
Translation table
GC content	62%
IMG OID	640417464
Product	predicted protein
Protein accession	XP_001417695
Protein GI	145346441
COG category	[R] General function prediction only
COG ID	[COG0220] Predicted S-adenosylmethionine-dependent methyltransferase
TIGRFAM ID	[TIGR00091] tRNA (guanine-N(7)-)-methyltransferase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACGC CGGCGTCCAC CGTCGCGGGC ACGCGCGTGG TGAAGATCGG GGACGCGTCG 
CTCGAGGTGC GGACGCGCGC GACGCGCGCG CGCGACGGCG CGACGGCGCG AACGCGCCAA 
CGCGCGCGAT GGGCGATGGG CGACTGACGG CGCGGTGACG ACGACGCAGG TGCCCTCGTT 
CGTGAGCGCG TCGAACGTCG GGACGAGCGC GCCGCGAAAG AAGCATTTTC GTCAGCGCGC 
GCACTGTAAT CCGTTGAACG ATGGGTACTA TTACGCGCCC GTGGGACCGT GGGAGATCGA 
CTGGCGCGAG CACTACGAGG AATTTTTCGC GAAGCGGGAC GGCGACGGCG ACGCGGGAAG 
TCTGAAGATA CGCTTCGCGG ACGTCGGATG TGGGTTCGGA GGGATGCTCG TGCGACTGGC 
GGAGGTGTTT CCGGAAAAGT TGATGCTCGG GATGGAGATA CGGGACAAGG TGAGCGAGTA 
CGTGCGCGAG CGGTGCGCGG CGTTGCGCAA GGACCACCCG GGTAAGTACT GGAACATTTC 
GTGCGTGCGG GCGAACGCGA TGAAAAATTT GCCGCAATAT TTCGAAAAGG GGCAATTGGA 
GAAGCTCTTC TTTTTGTTTC CCGATCCACA CTTCAAGGCG GCGAATCATA GGCGAAGAAT 
CGTGACGACG ACGTTACTCG CCGAGTACGC GTACGTGCTC GCCGAGGGCG GAATTTTGTA 
CACCATCACC GACGTCGAGG AACTCGGTAA ATGGATGTCC GATCACATGT CCGCGCATCC 
AATGTTTGAA CGCGTGCCCG AGGCTGAGCT CACGAAAGAT CCCGTGGTGC CGCTCCTTTA 
CACGGGCACC GAGGAAGGGC AAAAAGTTGA GCGAAACTCG GGTTCGACGT TTCTCAACGT 
CTTCAGGCGC GTCGCCAACC CGAACCATTA G

Protein sequence

MATPASTVAG TRVVKIGDAS LEVPSFVSAS NVGTSAPRKK HFRQRAHCNP LNDGYYYAPV 
GPWEIDWREH YEEFFAKRDG DGDAGSLKIR FADVGCGFGG MLVRLAEVFP EKLMLGMEIR 
DKVSEYVRER CAALRKDHPG KYWNISCVRA NAMKNLPQYF EKGQLEKLFF LFPDPHFKAA 
NHRRRIVTTT LLAEYAYVLA EGGILYTITD VEELGKWMSD HMSAHPMFER VPEAELTKDP 
VVPLLYTGTE EGQKVERNSG STFLNVFRRV ANPNH