Gene OSTLU_119554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_119554
Symbol	Mak16
ID	5000120
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009356
Strand	-
Start bp	542749
End bp	543850
Gene Length	1102 bp
Protein Length	226 aa
Translation table
GC content	44%
IMG OID	640415541
Product	MAK16-like nucleolar RNA binding protein, putative
Protein accession	XP_001416423
Protein GI	145343639
COG category	[R] General function prediction only
COG ID	[COG5129] Nuclear protein with HMG-like acidic region
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.113172
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAGTG ACGAAGTAGT TTGGCAGGTG CGCCCGCACG ATACTTTTGA TCCTACTCTT 
CCCGTCATCC ATACTATAAC ACAGATCATT AACCATGGAC AATGTAGCTA TAGGGCTACA 
TCAGAGACGT CCAATTTTTG TCGGAATGAA TTTAGCTTGA CTGGAATGTG CAACCGAAGT 
TCTTGTCCAC TTTCAAACAG TCAGTACGCG ACGATTCGAG AAGAGTGTGG TGAGCTACTC 
TTAGCGAACT GTGAAGTTCT GAAATTCACT TACTCAACTA GGCATCCTCA ACCTATACAC 
AAAGACTGTA GAGCGTTCAC ATATGCCTTC AAAGTTGTGG GAGAAGACGG AACTCAGTCC 
CAAATATGCG GAAGCTCTGG AACAGATAAA CTCTTCTCTG AGACATTGGT GAGTAAATTC 
CGAAACGTTT GAACAGGATC GTGATAAGCG GATTAGGCCA AAGTTTCTAG TTCACAAGAG 
CAAGCAACGT CTGACAAAGT TGACTCAGCT ACTCATACGT TCAAGGAAAT TAGAAAAAGT 
TGGGAGGTGA GTCAGGTGCA ACTGGTTCGT GACGAGTTCA TTTACTCTGA CTTTAGGGAA 
AAAATCCAAA CAATGCCAGC ACGACATACA CAGCGCGATG CGAGAGCGGA AAGTAAGGTA 
AAGTCTCTCG CGCACACAAT TTGCATACGA ATATTAACTT TCGTGAAAAC AAGGCTCAAG 
TGGCGGCGCG TTTGGACTCG AGTATTGAAA ATGAGTTGCT GGTATGCCTT ACTCCAGGTT 
ATGACGGCGC GAATTTGAGA AACGATATGT AGGAACGATT GAACGCTGGC GTCTACGAAT 
CTAGCTACCA ATTTTCTACG GCTAGATACT CACATGCTTT AGAGGTAGGC CAGACTCGCA 
AAAATATTGG ATTGTATCTA ACGCTTCTCT CTGCGACAGG GAACAAGGAA AATGGGAAGT 
CCAGAAACCA AAACTCCGCG GAAAATCCGC CAGCGCCGTC TACAACGGGA GATTGAATAT 
GAACAGATCA GGTAAGTGAT TACTGGTATT TTCCATGGAG ATATATATTT TACTTTTGTC 
CAGAACCTCA GTAGAACAGT GA

Protein sequence

MQSDEVVWQI INHGQCSYRA TSETSNFCRN EFSLTGMCNR SSCPLSNSQY ATIREECGIL 
NLYTKTVERS HMPSKLWEKT ELSPKYAEAL EQINSSLRHW PKFLVHKSKQ RLTKLTQLLI 
RSRKLEKVGR EKIQTMPARH TQRDARAESK AQVAARLDSS IENELLERLN AGVYESSYQF 
STARYSHALE GTRKMGSPET KTPRKIRQRR LQREIEYEQI RTSVEQ