Gene OSTLU_30814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_30814
Symbol
ID	5000570
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	+
Start bp	793834
End bp	795068
Gene Length	1235 bp
Protein Length	389 aa
Translation table
GC content	59%
IMG OID	640415991
Product	predicted protein
Protein accession	XP_001416764
Protein GI	145344489
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0754602
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CCGCGGCACA TCGCGCGGCA TGGCGACGCC GACGGTGATC GAGTGCCGCG TGCGCGGCGC 
GTACTGGCAC GTGAAAAACC ACCCGATGTC CGGCGTCACG CTCGTCGGGT GGGCGAGGAC 
GCTCTGGGCG CACGGACGGT CGATCGATGC GGTGGCGTTC GCGCCGAGGC TGATGTTTCT 
GACGTGCATG GCGCTCGCGA ACACGCTGGC GGCGATCGCG GACGGCGCGC TGCGCCCGAG 
GTGGGGTCGG ACGAAAGTGC GAGACGACCC GGTGTTCGTG CTGGGACATC CGAGGACGGG 
GACGACGCAC TTGCATAATA TATTGGCGAA AGACGAGACG CGCTTCGCCG CGGCGACGAC 
GTTCGACGTC GGGTTTCCGA GCGGGTTTCT CTCGAGCGGG TTCGTGAAGC CGTACCTGGC 
GAAAATGATG GATTCGACGA GACCGATGGA TAACATGGCG CTGACGATGG ACACGCCGCA 
GGAGGACGAG CTGGCGACGA ATCAATTGAG CGGGTGCGCG TCGCCGTACG CGCCGCTGAT 
GTTTATGCGA GACGAGGCGA AATTTCGCAA GTATTACGAG CTTCGAGAGG ATCACGACGA 
GTATCCCATC GAGCGCGCAG AGCTGGAGGC GTGGAAATCG GCGTTCATGA CGTTCATGAC 
AAAGTTGCAG TACAAGCACG GGGAGCACAA GCGGTTGGTG TTGAAGTCGC CCGTGCACGC 
GGCGCGCGTC GAGGTGCTTC GCAAACTCTT TCCGCGAGCG CAATTCGTGT TCATTTCTCG 
TCACCCGTAC GATGTTTTCA GATCTGCGGT AAACATGGCG GACAAGTACT ACTGGCAGTG 
CTTTTTGCAA CGCCCCACCG TGGCGGACGT GCAGGAATTC ATCCTCAAGC AGGGAGAAAT 
TTTACACGAC GCGTACGTGC GAGACTCGAA GTCGCTCCCG CGCGAAGCCT TGTTTGAGAC 
GCGATTCGAC GATCTCGACG CCGATCCCGT GGGCACGTTG TCGAAAATTT ATAAACATTT 
CGGATGGGAT GGATTCGACG AAACGGTCGC GCCGGTGTTG AAGGAATACG CGACGTCGCT 
CGCCGACTTT AAAAAGAATA GCTTTGCCGA GCTCTCCGAC GACGCCAAGG AGGTGATCAA 
CAGTCGCTGG GCGCGCTGGT TCACCGACTT GAACTACGAG AAACGATAGC GCTGTAGCGT 
AGAAATAACA GTAGAAAGAA GATTGCTCAT TAAAG

Protein sequence

MATPTVIECR VRGAYWHVKN HPMSGVTLVG WARTLWAHGR SIDAVAFAPR LMFLTCMALA 
NTLAAIADGA LRPRWGRTKV RDDPVFVLGH PRTGTTHLHN ILAKDETRFA AATTFDVGFP 
SGFLSSGFVK PYLAKMMDST RPMDNMALTM DTPQEDELAT NQLSGCASPY APLMFMRDEA 
KFRKYYELRE DHDEYPIERA ELEAWKSAFM TFMTKLQYKH GEHKRLVLKS PVHAARVEVL 
RKLFPRAQFV FISRHPYDVF RSAVNMADKY YWQCFLQRPT VADVQEFILK QGEILHDAYV 
RDSKSLPREA LFETRFDDLD ADPVGTLSKI YKHFGWDGFD ETVAPVLKEY ATSLADFKKN 
SFAELSDDAK EVINSRWARW FTDLNYEKR