Gene OSTLU_2153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_2153
Symbol
ID	5005358
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	-
Start bp	228339
End bp	229529
Gene Length	1191 bp
Protein Length	397 aa
Translation table
GC content	56%
IMG OID	640420779
Product	predicted protein
Protein accession	XP_001421425
Protein GI	145354297
COG category	[R] General function prediction only
COG ID	[COG0661] Predicted unusual protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.104794
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GCGCCGGTGA TCGTGCGACG GACGTTTGAG GCGCTGGGGG CGACGTACGT GAAATTGGGA 
CAGTTCATCG CGAGCGCGCC GAGCGTGTTT CCGAAGGAGT ACGTGGAGGA GTTTCAAAAG 
TGCCTGGACG CGACCGAGGT GACGGATTTT TCCATCATTA AGCGGACGAT CGAGAAAGAC 
TTGGGACGTT CTATAGATGA TGTGTTCGCG ACGATCGATC CGGTGCCTTT GGCGAGCGCG 
AGCGTGGCGC AGGTGCATCG AGCGACGCTG CTCGGAAGCG GGCGAGACGT CGTCGTCAAG 
GTGCTGAAAC CGAACGTCGA GGACACGCTC AAGGCGGATT TGAGCTTTGT GTTAATCGTG 
AGCAAGGTGT TACAGTTTTT GAATCCTGAA CTCTCGCGAA CATCGTTGGT GGACATCGTC 
GGAGACATTC GAGAGTCGAT GTTGGAGGAG ACGGATTTTA GAAAGGAGGC GCAAAACGTC 
GACGCTTTTC GACGATACCT TGAAGACGCG GAACTGACGA ACATCGCCAA GGCGCCGCAA 
GTGTACAAAC AATTTAGTGG TAAACGAGTG ATGGTGATGG AGTACTTCTC TGGCGTCCCG 
CTCACGGACT TGGAGGCGAT TCGTTCGGTG AGCACGCGCG ATCCCGAGGC GACGCTCATC 
AACGCGCTCA ACGTTTGGTT TGGCAGCGTG CTGGCGTGCG AGAGTTTTCA CGCCGACGTG 
CACGCGGGTA ATCTGATCGT TTGTCCGGAC GGGCGCGTTG GTTTCATCGA CTTCGGCATC 
GTCGGCAAAA TTTCCCCGTC AATTTGGGGC GCGGTGCAAG CTTTTTTCCA ATCCACCGCC 
GCGCGCGATT ACGAGCGCAT GGCGCTCGCG CTGGTGACGA TGGGGGCCAC CGACGGCGAA 
GTCGACGTCA AGAAATTCGC TAATGATTTA CGCAAAGTCT ACGAAACCTT AGATTCCATC 
GAACCGACTG TTCTTGTCGA TGAAGACACC TTCGACGGCA CCCCTCGCGC CGCCGTGACC 
GTCGACCAAC AGCAAGTGAC GCAGTTGGCC TCCGACTTGA TCGTCGCCGC CGAGGAGAAC 
AAAATCAAAC TCCCCAAAGC GTTCGGCATC TTGATCAAAC AACTGATTTA CTTTGACCGT 
TACGTGCAGT TACTCGCACC CGACTTAGAG GTCATCGACG ACGATCGCGT G

Protein sequence

APVIVRRTFE ALGATYVKLG QFIASAPSVF PKEYVEEFQK CLDATEVTDF SIIKRTIEKD 
LGRSIDDVFA TIDPVPLASA SVAQVHRATL LGSGRDVVVK VLKPNVEDTL KADLSFVLIV 
SKVLQFLNPE LSRTSLVDIV GDIRESMLEE TDFRKEAQNV DAFRRYLEDA ELTNIAKAPQ 
VYKQFSGKRV MVMEYFSGVP LTDLEAIRSV STRDPEATLI NALNVWFGSV LACESFHADV 
HAGNLIVCPD GRVGFIDFGI VGKISPSIWG AVQAFFQSTA ARDYERMALA LVTMGATDGE 
VDVKKFANDL RKVYETLDSI EPTVLVDEDT FDGTPRAAVT VDQQQVTQLA SDLIVAAEEN 
KIKLPKAFGI LIKQLIYFDR YVQLLAPDLE VIDDDRV