Gene OSTLU_14901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_14901
Symbol
ID	5001152
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009358
Strand	+
Start bp	119282
End bp	120421
Gene Length	1140 bp
Protein Length	379 aa
Translation table
GC content	67%
IMG OID	640416573
Product	predicted protein
Protein accession	XP_001417150
Protein GI	145345294
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.0674562
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCCCG GCGACGCGCG CGACGGCGCG TCCGCGCTCG ACGTCGCCGC GCGCGCGGCG 
TCGCGCGCGG AAGACGACGC GTGGGACGCG CACCACGACG CCCTGCTCGC GTGGTCCGTC 
GCGGACGGCC GCGACGGCGC GTGCAACGCG CCCTGGCGCG CGACGCACGC GGGACTCAAC 
ATCGGCGCGT GGCTGCAGAA CCAGCGCGCG AAGCTAAGGG CGAAAAAGAT GCCGAGGGAG 
CGGGCGACGA GGCTGGACGC GCTGACGGCG GCGGGACGAT TGTGGATCGA CGCGCCGGGA 
CGGAAGGGAT GGAACGAACA GCTCGAGAAG CTCGCGGCGT GGGCGGAAAA GACGAACGGA 
GGGGTTGATT ATAACGCGCC GGTCGGGACG ACGCACGAGG GGGCGAAGAT CGGGGCGTGG 
TTGGCGACGC AGCGAACGCG GCGAAGAGAC GGCGAGAACG CGCGGCGACC GCTCAAGCCG 
GAGCAAGCGG CGGCGCTGGA CGCGCTCGTC CTGAGGGGGG TGCTGAGGTG CGAGAAAGCG 
GATCCTTGGC CGAGGAAGTG GGCGCTGGTG CTGAAGTGGG GGGAAGAGCG CGCGAACGGG 
GAGCACTTTA ACGTGCCGTA CGATTACAAG GATGGCGACG AACGCGTGGG GGTGTGGTTG 
AACACGCAGC GACAGCGGTT CCGCGGAGGG ACGACGAAGA ATTTGCCGCT CACGCCTTGG 
CAGACAGAGC AAATGCAAGC GATGATCGAC GCCGGTAAGC TCTGGGTGCA CGCCCCGGAC 
GACGTGTGGG AGAAGAAGTT CGCGCTGCTC TTGCGATGGG GCAAAGAGAA GACGCGAGGC 
GTCAACTACA ACGTGCCGCA GGGCGAGGAG TACGAGGGCG TCAACCTCGG CTCGTGGTTG 
AGCACGCAGC GCGCTCGACT GTTGCACGAG ACTCTCGGGA AAAACAGACC GCTCAGCGAT 
GACGAACGTC GAAAGTTGCA GAAACTCATC GACGACGGCA AGCTGCGACC GTCGACGCCG 
CGAGGCAAGA ACGCGGCGAA GGGACAGGGC AAGCGCGCGC CGCGAGGCAA TCTCGACGAC 
GTCGACGCCG CGCTCAACGT CGACCTGCCG CACACGTCGA AGAGAGGACG TAAAACGTAA

Protein sequence

MPPGDARDGA SALDVAARAA SRAEDDAWDA HHDALLAWSV ADGRDGACNA PWRATHAGLN 
IGAWLQNQRA KLRAKKMPRE RATRLDALTA AGRLWIDAPG RKGWNEQLEK LAAWAEKTNG 
GVDYNAPVGT THEGAKIGAW LATQRTRRRD GENARRPLKP EQAAALDALV LRGVLRCEKA 
DPWPRKWALV LKWGEERANG EHFNVPYDYK DGDERVGVWL NTQRQRFRGG TTKNLPLTPW 
QTEQMQAMID AGKLWVHAPD DVWEKKFALL LRWGKEKTRG VNYNVPQGEE YEGVNLGSWL 
STQRARLLHE TLGKNRPLSD DERRKLQKLI DDGKLRPSTP RGKNAAKGQG KRAPRGNLDD 
VDAALNVDLP HTSKRGRKT