Gene OSTLU_50433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_50433
Symbol
ID	5003654
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	+
Start bp	251748
End bp	252855
Gene Length	1108 bp
Protein Length	331 aa
Translation table
GC content	61%
IMG OID	640419075
Product	predicted protein
Protein accession	XP_001419536
Protein GI	145350271
COG category	[R] General function prediction only
COG ID	[COG5273] Uncharacterized protein containing DHHC-type Zn finger
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.120441
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGCGCGGTCG CGTCGCGCGC GCGTCGCCGC GGTCGCTCGG ACTCGATTCC GACGACGCGC 
GCGCGCGATG GCGTCGCCCG CGCGACGGAC GCGCGAGACG GACGACGCGA CGGTGAACGC 
CATGGGTGGC GATCGAAACG TGTTCGCGTC GCGCGCGTGC GACGCGTGCC GCGCGCTCGG 
GTCGTTCATG GTGCTCGTCG TGCTGGCGAT CGTCGGGCTG ACGTACTACG CCACGGTGGT 
CGTCGTGTAC GGACCGTTGG CGGCGGAGGG GGGGGAGGAC GCGGGCGTGG CGACGGGGGC 
GCTGTGCGCG TATCACGTCT TCGCGTTCAT GCTGCTGTGG TCGTACTTTG CGTGCGTGCT 
GACGGCGCCG GGAGACGTGC CGAGGGGGTG GACGCCGGCG CCGGAGGATC CCGAGGAGGC 
GGCGTCGGAG GCGAAGAAGT CGAACAGCGA AAAGAGACGG CGGTTTTGTA AAAAGTGCGC 
GGCGTGGAAG CCGACGCGGA CGCACCACTG CTCGGTGTGC AAACGATGCG TGTTGAAGAT 
GGATCATCAC TGCGTGTGGG TCGCGAATTG CGTGGGGGCG TATAACTATA AATTTTTTCT 
GCAGTTTTTG GCGTACACGT TCTTGGCGAC GGTGCTGGAT GCGATTTTAC TGTTGAGCAA 
TTTTATAGAT TTCTTCAAAG ACGTCGAGGA GAGTCAGGCT GCGGGAAGCC AAGGGGCGGA 
CGCGAAGGTC GATCCGGCGG AAGGAACGGA GTTAGCGGTG GTGTTTGTGA CGTTTATAGT 
CAACGTGGCG TTCTCGGCGT CGTTACTGGG CTTTTTAGTG ATGCACGGTA ACTTGATCCT 
GAGCAACATG ACGACGATCG AAATGTACGA AAAGAAAAAG ACGCTTCCGT GGAAGTACGA 
CTTGGGAAGG TTCAGAAACT TCAAGGAAGT GTTTGGAGAG AACGTTTTCA TGTGGTTCCT 
CCCCGTGCAT TCGAGCTCGC ACTTGGAAAA GATGCGCGTG AACACGGGGA TTTCAGACGG 
GGAATGTTTA GAAGGCGCCG CGTACGCCAG GGCGTGCGAA AGCGCGCAAC GAGAGGCGAC 
GATCGGGAAT AGAAAAGGTC GAGCGTAG

Protein sequence

MASPARRTRE TDDATVNAMG GDRNVFASRA CDACRALGSF MVLVVLAIVG LTYYATVVVV 
YGPLAAEGGE DAGVATGALC AYHVFAFMLL WSYFACVLTA PGDVPRGWTP APEDPEEAAS 
EAKKSNSEKR RRFCKKCAAW KPTRTHHCSV CKRCVLKMDH HCVWVANCVG AYNYKFFLQF 
LAYTFLATVL DAILLLSNFI DFFKDVDPAE GTELAVVFVT FIVNVAFSAS LLGFLVMHGN 
LILSNMTTIE MYEKKKTLPW KYDLGRFRNF KEVFGENVFM WFLPVHSSSH LEKMRVNTGI 
SDGECLEGAA YARACESAQR EATIGNRKGR A