Gene OSTLU_35576 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_35576
Symbol
ID	5002962
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009361
Strand	+
Start bp	223001
End bp	224149
Gene Length	1149 bp
Protein Length	382 aa
Translation table
GC content	62%
IMG OID	640418383
Product	predicted protein
Protein accession	XP_001418643
Protein GI	145348413
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.98269
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.38201
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCGCT ACGTCAAGGG ACGCACGCTC GGTGAGGGCA CGTTCGGCGT CGTCCACGAG 
GCGCGCGTCG AGGCGACGGG CGAGCGCGTG GCGATCAAAA AGATTCGACT CGGGAAACTC 
AAGGAGGGCG TCAACTTCAC GGCGATACGC GAGATCAAAC TGCTGCAGGA GATCGAGCAC 
GAGCACGTCA TCGCGCTCGT CGACGTGTTC GCGCACAAGA AGAACCTGAA CCTGGTGTTC 
GAGTTCTGCG GCGGGGACCT GGAGATGGTG ATCAGGGACA AGACGGCGCC GCTGGAGCGA 
GGGGAGGTGA AGTCGTACGC GATGATGACG CTGCGAGCGG TGGCGCACTG TCACGAGAGA 
TGGGTGCTGC ACAGAGATTT GAAACCGAAC AACCTGTTGA TCGCGCCGAA CGGGTGCTTG 
AAGTTGGCGG ATTTTGGGTT GGCGCGGATA TTCGGGTCGC CGGATAGACG GTTCACGCAT 
CAGGTGTTCG CGAGGTGGTA TCGCGCGCCG GAGTTGTTGT TGGGGTCGAA GACGTACGGA 
CCGGGCGTGG ATATTTGGGC CGTGGGGTGT ATCATCGCGG AATTGATGCT CCGGCGGCCG 
TTCTTCGCGG GATCGTCGGA TATCGATCAG TTGGGGAAGG TGTACGCGGC GCTAGGGACG 
CCGACGGAGA CGAATTGGCC GGGGGTGTCG GCGCTACCGG ATTTCATCGA GTTTGTGTAC 
GTGCCGCCGC CGAATCTTCG CGATACGTTC CCGAACGAAA CGGACGAGGC GCTGGATCTG 
TTGCGGAAGA TGCTCGAGTA CGATCCGAAT AAGCGTATCA CCGCCGCGCA GGCTTTAGAG 
CATCCGTACT TTCACACCAA GCCCGCGCCG ATTCCGTACG AACAGCTTCC GAAGCGGTTC 
GTCGCGAAAG AAGCCGAGGC GAACGCGGCG GCGGCGGCGG CGGCGGCGGC GGCGGCGGGG 
GATGAAGAGC CAGCTTCACC CGCGTCCGCA CGTCAGCCGA AGACTGGCGA GAAACGTAGA 
CTAGAGGACA CCACCGACTC GACGGATCCA AACTTTCGCC CGAAGCTCGA CGAAGAGGAC 
AGGGAATCTT TGCGAAAACG AAAAGGCGCG CTCGACGCCG CGTTCGCTGA CGTCGACGGA 
GACGACTGA

Protein sequence

MDRYVKGRTL GEGTFGVVHE ARVEATGERV AIKKIRLGKL KEGVNFTAIR EIKLLQEIEH 
EHVIALVDVF AHKKNLNLVF EFCGGDLEMV IRDKTAPLER GEVKSYAMMT LRAVAHCHER 
WVLHRDLKPN NLLIAPNGCL KLADFGLARI FGSPDRRFTH QVFARWYRAP ELLLGSKTYG 
PGVDIWAVGC IIAELMLRRP FFAGSSDIDQ LGKVYAALGT PTETNWPGVS ALPDFIEFVY 
VPPPNLRDTF PNETDEALDL LRKMLEYDPN KRITAAQALE HPYFHTKPAP IPYEQLPKRF 
VAKEAEANAA AAAAAAAAAG DEEPASPASA RQPKTGEKRR LEDTTDSTDP NFRPKLDEED 
RESLRKRKGA LDAAFADVDG DD