Gene OSTLU_93535 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_93535
Symbol
ID	5004758
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009366
Strand	+
Start bp	264291
End bp	265598
Gene Length	1308 bp
Protein Length	435 aa
Translation table
GC content	61%
IMG OID	640420179
Product	predicted protein
Protein accession	XP_001420640
Protein GI	145352625
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.742776
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCGAC GCGAGCGCGC GTTGTGGTCG TTAGAACACG CGCTGTCGAG CCCCGAAATC 
CCGCTCGACG TCAAGGTGGA GGTGAAAAAC GCGTGCGCGG CGTCGCTCGA CGACGAGACG 
CTGGCGTCGT GCGATTCGCT CGTCGTGCGA TTGTTTGACG TTTTATCCCG CGCGCGCGAT 
GCGTTGATCG CCGGTGAGGG CGCGATGCGA GGAAACAGCG CGCGCGCGTG CGCGGACGCG 
CTGCACGCGG TGACGACGCG ACGCGACGCG CCGGAAACGC TGAAAAGGAG AGGGAAAGAC 
GTCGTCGAGG CGCTGCGCGG CGAGTGGTGC TTCGCGGCGG CGAGAGAGAC GCGGAACGAG 
GGAGGGACGA GCCCGGTGCG AGGATGGAAA GCGATGGAGA ATTTTTGGAT GCGGTGGCGA 
ACGCTGACGA TCGGTGACGG AGGGCTGGGC GATGGGAGCG CGTTGGGAAC GAAGGCGAAG 
AGGACGTACG ACATGGTCGA GCGCGCGGAG AGCGATATGC GGTTGCCGAG CGACTGGGAG 
AGTCGCGTGC CCACGGCGGA GGATATAGCG CAAGATTTAC AAACGTTGTT CACAGATCTG 
TGCGAAAGCG GTGAATTGAT GAGTTTCTTG AGCGTCGTGA GGAACGATAT CTCGAGCGGG 
AGGTACAAGG TGCAGGTGAG AGGAGACGGG CGCGTGGCGC GGCAATCGGG CGCGATGACG 
GATTCGATTG GACTCGAGCC GCACCTCGAG GGATTGGGTC GAAAGCTCAG GGCGGAGGCG 
ACGAGACACC GACAAGAACC GCCGTTAGGT GCTCTAACCG CCGTGCCGGA AAGCTTTTCC 
TCGCCGCCGA AGCGCGTACA CATAGCGGCT CAACGAAAAA AGAACGCGCG AACCGTGGAG 
TGGGATTCGC AAAACGACCA ACCAGACGAC AACGACAAAG AAGAAGAAGA CAAAGATGAA 
CACGAAGATA TCGCGCCCAC ACAGCAAACC CCTCGCGCAA AGCCATCACC ATTAACCAAT 
TTATCTTGGG AAGAGGTCGG ATACCGCACG CCACGCGCGA ATCTACCCGC CATTTCGCCG 
GCGCCCAGGG CTGCGCTGAA ATCGCCGTCG ACGCGCAAGA AGCTTCACGT GAAGGTGAAG 
TGGACGGACG CCGAAGTCAC GTGTTTGCAC CTCGGCGTGC AAAAGTACGG CATTGGGAAT 
TGGGCGAAGA TTTTGAACGA TCCGACGCTC ACCAACGGCT TTCACACGTC TCGCACCGGC 
GTGCATTTGA AGGACAAGTG GCGCACGATA CAACGACAAG CGCGTTGA

Protein sequence

MQRRERALWS LEHALSSPEI PLDVKVEVKN ACAASLDDET LASCDSLVVR LFDVLSRARD 
ALIAGEGAMR GNSARACADA LHAVTTRRDA PETLKRRGKD VVEALRGEWC FAAARETRNE 
GGTSPVRGWK AMENFWMRWR TLTIGDGGLG DGSALGTKAK RTYDMVERAE SDMRLPSDWE 
SRVPTAEDIA QDLQTLFTDL CESGELMSFL SVVRNDISSG RYKVQVRGDG RVARQSGAMT 
DSIGLEPHLE GLGRKLRAEA TRHRQEPPLG ALTAVPESFS SPPKRVHIAA QRKKNARTVE 
WDSQNDQPDD NDKEEEDKDE HEDIAPTQQT PRAKPSPLTN LSWEEVGYRT PRANLPAISP 
APRAALKSPS TRKKLHVKVK WTDAEVTCLH LGVQKYGIGN WAKILNDPTL TNGFHTSRTG 
VHLKDKWRTI QRQAR