Gene OSTLU_29872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_29872
Symbol
ID	5000093
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009356
Strand	+
Start bp	103988
End bp	105245
Gene Length	1258 bp
Protein Length	411 aa
Translation table
GC content	60%
IMG OID	640415514
Product	predicted protein
Protein accession	XP_001416072
Protein GI	145341970
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CCTCAACCGC CGTCGACATG CGAGTCTCGG TGCACGTCGC CGAACTCGAC CTCATCGTCA 
ACGTCGACGT CTCTCCGGAC TGTACGGTCG CAGACCTCAA AGCTGCCGTC GCCTGTGAGT 
TCCCAGACGG CGATCCGCGC GATATAACGC GCGCCAAAGT TTTGAAAGAT GCCAAGCAGA 
TTCCAGATGC GTCAAGTTTA CGCGACGCCG GCGTCGTGCA GGACGACCTG TTGATCGTGT 
CGCTGGGTGC ATCCGGTGGG GAAAGCATCG CGTCGGCGGA CGCGCGCGCG CTTGCGGCGG 
ATGGTAGCGC AGTGGACGCG CAGGCGATGA TGGAGAGTTT TCGCGGCAAC GCCGGCACGC 
TCGAGGCGTT GCGTCGGCAG GGAGGAAGCG AACTCGTCGA TTGCATCGAA GCGAACGACG 
TGGAGGGGTT TCAGAGAATG ATGCGGGAGA TGCGGAAACG GATGTTAGCG GCGAGGGAAC 
AGGAGGCGGA GGAGATGGCG TTGATGACGA GCGACCCGTT CGACGTCGAG GCGCAGCGGA 
AGATTGAGGA ACGCATCCGA CAAGAACAGG TGTTAGGCAA TTTTGCGACC GCGATGGAGG 
AAACGCCCGA GGCATTCGCT CAGGTGGTGA TGCTATACGT CGATCTGGAG GTGAATGGAG 
TGGCGCTGAA GGCGTTTGTC GATAGTGGGG CGCAGATGTC GATCATGTCG GTGACGTGCG 
CGCGACAGTG CGGACTGGAA AGGCTCATCG ACAAGCGGTT TAGCGGCATC GCGAAAGGCG 
TGGGGACGCA GAACATCATT GGACGCGTGC ACCAGGCACC GATGAAGGTG GGTGAACACT 
TCTTGCCGTG CGCGATTACG GTTTTGGAGA AGGAACAAGA CATGGACTTC ATCTTTGGTT 
TAGACATGCT GCGCAGACAC GCGTGCTCCA TCGACTTGAG GAAGAACGCC CTCGTTATCG 
GCTCGGTCGA CGTGGAGTTG CCGTTTTTGA GCGAGAGCGA AATTGGAAAG ACAGCACAGG 
AAGCGTTTCA AGGCAAAGCG CCCGAGGCGG CGATCCCGAC CCCCTCGGCG GCGGTCCCGA 
CCCCCTCGCC GGCGGTCCCG ACGCCCTCGA CGACGCCTTC GTCTTCGTCG GCGCACGACG 
AAGAAAAAAT TGCTCGATTA ACCGCGCTCG GCTTTTCTCG GCAGCAAGTT ATCGACGCCT 
TGAACGCGAC GAGTGGTAAC GAAGAGTTTG CGGGTGCGCT ATTGTTCGGT TAAACGCT

Protein sequence

MRVSVHVAEL DLIVNVDVSP DCTVADLKAA VACEFPDGDP RDITRAKVLK DAKQIPDASS 
LRDAGVVQDD LLIVSLGASG GESIASADAR ALAADGSAVD AQAMMESFRG NAGTLEALRR 
QGGSELVDCI EANDVEGFQR MMREMRKRML AAREQEAEEM ALMTSDPFDV EAQRKIEERI 
RQEQVLGNFA TAMEETPEAF AQVVMLYVDL EVNGVALKAF VDSGAQMSIM SVTCARQCGL 
ERLIDKRFSG IAKGVGTQNI IGRVHQAPMK VGEHFLPCAI TVLEKEQDMD FIFGLDMLRR 
HACSIDLRKN ALVIGSVDVE LPFLSESEIG KTAQEAFQGK APEAAIPTPS AAVPTPSPAV 
PTPSTTPSSS SAHDEEKIAR LTALGFSRQQ VIDALNATSG NEEFAGALLF G