Gene OSTLU_4231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_4231
Symbol
ID	5003365
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	-
Start bp	143545
End bp	144600
Gene Length	1056 bp
Protein Length	322 aa
Translation table
GC content	62%
IMG OID	640418786
Product	predicted protein
Protein accession	XP_001419293
Protein GI	145349754
COG category	[Z] Cytoskeleton
COG ID	[COG5059] Kinesin-like protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.892014
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.224356
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GGGAGCGTCC GCGAGAGCGT CGCGGGCAAG GCGGCGCTGA GTTTCGCGTA CGACCACGTG 
TGCGATCAGT CGTCGGCGCA GGAGGAGATT TTCGAACGCG TCGGACGCGA CGCGGTGGAC 
GGCGTGGTGG AGGGGTATCA CGGGTGCGTG CTCGCGTACG GGCAGACGGG CGCGGGGAAG 
ACGTACTCGA TGCAAGGCGT GGATTTAGAT CGCGACGACG ACGTCGGAGG GTTTGAGGGT 
GACGATGATT GCGTCATGAT GTCGCCGGGC GAGGCGGGAG GGGCGGAGGG GGACGCGCTG 
GACGCGCCGA ACGCGGGGTT GATTCCGCGC GCGCTGAAGC GATTGTTTGA GCGATGCGAG 
TCGGCGAGGA ACGCGGCAAT CGAAGCGGGC GGGGCGTGCG AAATCGAAGT GAAGTGCTCG 
TATTTGGAGA TTTATAACGA GACGTTGCGA GATTTGTTGA TGAATACCGA GCACGATGGA 
CCGGCGCCGA ACGTGCGGGA AGACGCCAAG CGAGGCACGT TTGTGGAGAA TTTGCACGAG 
GAGCGCGTGC ACGGGGCGGA GCAGACGTAC GAGACGTTTT TGCGCGGTGC GGCGAATCGT 
AGGGTGGGTC AGACGAATAT GAATGCCGAT TCTTCGCGTT CGCACAGCGT GTTCACGATT 
TCGGTGGAAT CGCGCACGAA GGCGCATCCC ACGGCGCCGA CGACAAAAAA GAGCGCGCTT 
TTGCACTTGG TCGATCTCGC AGGGAGCGAG CGGCAGAAGA GCACGGACGC GGCAGGTGAA 
CGTTTGAAAG AGGCGAGCGC GATTAATAAA TCGCTCAGCG CGCTCGGGAA CGTCATCAAA 
GCCCTCGTGG ACGTGGCCGA CGGCAAGGAA CGACACGTGC CCTACCGCGA TTCCAAGTTG 
ACGTTTTTGC TCAAGGACGC GCTCGGCGGA CGCGCGCGCT GCACGCTCCT CGCGTGCGTC 
TCGCCGGCGC ATGTGAACGT GGAGGAGACA ATGTCTACGC TGAAATTCGC CCAGCGCGCC 
AAGCTTGTGA AAGTCCGCGC AGTGGCGAAC GAAGAA

Protein sequence

GSVRESVAGK AALSFAYDHV CDQSSAQEEI FERVGRDAVD GVVEGYHGCV LAYGQTGAGK 
TYSMQGGDAL DAPNAGLIPR ALKRLFERCE SARNAAIEAG GACEIEVKCS YLEIYNETLR 
DLLMNTEHDG PAPNVREDAK RGTFVENLHE ERVHGAEQTY ETFLRGAANR RVGQTNMNAD 
SSRSHSVFTI SVESRTKAHP TAPTTKKSAL LHLVDLAGSE RQKSTDAAGE RLKEASAINK 
SLSALGNVIK ALVDVADGKE RHVPYRDSKL TFLLKDALGG RARCTLLACV SPAHVNVEET 
MSTLKFAQRA KLVKVRAVAN EE