Gene OSTLU_50173 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_50173
Symbol
ID	5003240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	+
Start bp	352112
End bp	353309
Gene Length	1198 bp
Protein Length	389 aa
Translation table
GC content	55%
IMG OID	640418661
Product	predicted protein
Protein accession	XP_001419137
Protein GI	145349431
COG category	[R] General function prediction only
COG ID	[COG2319] FOG: WD40 repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.828985
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GAAAAAGGCG CCGAGCGATA TAGCGTCGAT GATTGACGCG CTGGACGATG AGGATGAGCG 
CGATGGTGGG TCGCAGGCCG GACCGTCGAA GGCGTTGGCG GCGTTCCGGG GCGAAGACGC 
TAAAGCCAAC CTGCCGGTGT CCATCTTCGG TAGACACGCA AACGCGGCGA CTGGGGCGAA 
TATCGCGAAG AGATTGGCGA GCGAATGGCC GGAGCCGGAG TGGCGAGCGC CGTGGAAGCT 
TTATCGTGTG ATTTCGGGAC ACCAAGGGTG GGTGAGATCG TGCGCCGTCG ACCCGGGGAA 
CGAGTGGTTC GTCACGGGCA GCGCAGATCG CACCATCAAG GTTTGGGACT TGGCGAGTGG 
CAGCTTGAAG CTCACTTTGA CCGGTCACAT CGAACAAGTC ACCGGTATCG TGGTGAGCCA 
GAGGCATCCG TACATGTTCT CGTGCGGTTT GGATAAAAAA GTCAAGTGCT GGGACTTGGA 
GTACAACAAG GTGATTCGTA ACTATCACGG GCACCTTTCG GGAGTGTATT CGATCGCGAT 
GCACCCGACT TTAGATCTGT TGATGACGGG CGGTCGAGAC AGTGTGTGCA GAGTTTGGGA 
CATGCGCACA AAGAGACAAG TGTACTGCCT CACTGGACAC GAGAACACCG TTGGATCCAT 
ATTAGCGCAA GACGAGAATC CGCAGCTCGT CACCGGTTCG TACGACAGCA CGGTTCGCTT 
GTGGGACTTG GCGACTGGTA AAACGATACA TACACTGACT CATCACAAGA AGGGCGTGCG 
TGCTATGGCG ATGCACAAGA AGGAATTCGC ATTCGTTTCC GCTTCAGCTG ACAACATTAA 
AAAATTTTCG TGCCACGGTG ACTTCATGCA CAACATGTTG AGCAAACAGA ATTCCATCGT 
GAACACGCTG TCTATGAACG ACGATGATGT TGTCTTTAGC GGTGGTGATA ACGGTAGCAT 
GTGTTTTTGG GACTACAAGT CTGGGCATTG CTTCCAACAA GAAAAGGCGT TGGTGCAACC 
CGGTTCGTTG GAAGCCGAAT GCGGGATCTA CGCCTCCACT TTTGACGTCA CCGGTTCGCG 
CTTGATCACG TGCGAGGCCG ACAAAACGAT CAAGATGTGG AAGGAGGACA CCGAGGCTAC 
GCCTGAGAGT GCGCCGATTC TTCCCTTTGC CCCACCCAAG AATATTCGGC GAAGTTGA

Protein sequence

MIDALDDEDE RDGGSQAGPS KALAAFRGED AKANLPVSIF GRHANAATGA NIAKRLASEW 
PEPEWRAPWK LYRVISGHQG WVRSCAVDPG NEWFVTGSAD RTIKVWDLAS GSLKLTLTGH 
IEQVTGIVVS QRHPYMFSCG LDKKVKCWDL EYNKVIRNYH GHLSGVYSIA MHPTLDLLMT 
GGRDSVCRVW DMRTKRQVYC LTGHENTVGS ILAQDENPQL VTGSYDSTVR LWDLATGKTI 
HTLTHHKKGV RAMAMHKKEF AFVSASADNI KKFSCHGDFM HNMLSKQNSI VNTLSMNDDD 
VVFSGGDNGS MCFWDYKSGH CFQQEKALVQ PGSLEAECGI YASTFDVTGS RLITCEADKT 
IKMWKEDTEA TPESAPILPF APPKNIRRS