Gene OSTLU_30597 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_30597
Symbol
ID	5001067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	-
Start bp	433308
End bp	434882
Gene Length	1575 bp
Protein Length	524 aa
Translation table
GC content	67%
IMG OID	640416488
Product	predicted protein
Protein accession	XP_001416947
Protein GI	145344870
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.355586
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0445175
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCGCC CGACGCGCGC CGAGCTCGCG CGTCACGCCC CGGCGCTGGC GTGCTACTTT 
TTCCTGACCC TCGCCGTGGA GTCGTCGACG ACGCCGCTCG CGCTGGTGCG GAATCGCGCG 
CTCGCGTGGG ACGAAACGCC CGAGGGCGCG AATCGCTTTT ACGCCTTTGT GTTCGCGGTG 
GCGACGTTAA AGCCGCTGTA CGCGTCGGTG AGCGACCGAT CGCGCGCGAG GGGGGGCACG 
CGAGCGGCGC ACGTCGCGCT CGGATGCGCG GTCGCGCTGG CGGGCGCGCT CGGGTCGAGC 
GCGGCGCGGA CGACGGCGCA GACGTACGGG TTCGGGACGC TGGCGAGCGC GGGCGCGGCG 
CACGCGTACG CGTCGTTGGA TGGATACGTC GTCGAGAGGT TCGGCGGGGA AGCGGGAAGG 
TCGAGGGATG AGGTGGTGAT GGCGCAGGCG TGCGCGATGG CGGCGAGGAC GGCGGGGAGC 
GTGGTGGGGG ATTTAGCGAG CGCGGGAGGA CTGGCGGCGG CGAGCGCGCG GACGGCGGCG 
GCGGCGAGCG GGATTTGGAT GCTCGTCGCG ATCGCTGTGG CGTTAGTGAG CGTGGATGAG 
AGTGATATAT CGCGAGATGT CGATTCGGGA AGAGAAGATG AGCGTGAAAT GGAGTCGCGG 
TCGTGCGCGT CGTGGACGGC GCGAGCGAAG GAGGCGTACG CGCCGCTCGC CGAGGTTGAT 
TTTTTACGGT GCGCCGCGTT GGTGTTTTTA TACCGCATCG CACCGACGGC GTTGGATACA 
TTCGCGTCGT ATACGTACGC CGTGTTCAGC GATAGGATGA AGGATTATGA GTTTGGTTTG 
GTGGCGTTCT TTACGTCGCT CGGCGCGCTC GCCGCGCCGG CGGCGTTCGG TTGGGCGTTC 
GGAGACGCAA GCGCGTCTGG TAGTTCTGTG GGTGAAAACG ACGCCGGAAC GTTGACGAAG 
ATTCGTGCGC TTCTCGTCTC GTCGCCCACG TGGATGATGT TCGTCTTCGG CGCCGTCGTA 
GACGCGGCGC TGGGTCTCTG TCGACTCTTC ATCGTGTGGC GGCCGCCCGC AACCGGCGCC 
GTGGCGGCGT TATCTATCGT CAACGCGCTC GCAATTTTTG GCTTGCGCGT GGGTTACATG 
CCAATCGTCA CATTAGGCGC GATCATGGCT CCGCAAAACC TCGAAGCCGT CGGTTTCGCG 
GCGCTGATTT TCGCCAGCGA CGTCGGCGCG CTCGTCTCCG CCTACGTCTC CGCCGGCGTC 
GTCCGCGCCC TACACATCGG TGCGCCCACG CGCACGGACA CCACCGGCGC CGTCATTCCA 
ACCGATCGTT CGTGGTCACC TCTCACCGCC TTCCTCGTGC TCGTCGCCGC GTGCAAGATC 
ATCATCCCGT GCGTCTCCGC GCCGCCGCTC CTTTCGTCGG CGTCTCGGCG TTCGCGCGCC 
GCCGACTTCT CCCTCCTCCC CGCCGACGCC GATCGATCCC ACGCCACCGT CGACGACGCC 
GCGCGCGATT CCAACGCGTC AACGCGGCCG TCTTCTCCCC CTTTCGACCT CGCATCGCCG 
TCCGCGGAGC TGTAA

Protein sequence

MTRPTRAELA RHAPALACYF FLTLAVESST TPLALVRNRA LAWDETPEGA NRFYAFVFAV 
ATLKPLYASV SDRSRARGGT RAAHVALGCA VALAGALGSS AARTTAQTYG FGTLASAGAA 
HAYASLDGYV VERFGGEAGR SRDEVVMAQA CAMAARTAGS VVGDLASAGG LAAASARTAA 
AASGIWMLVA IAVALVSVDE SDISRDVDSG REDEREMESR SCASWTARAK EAYAPLAEVD 
FLRCAALVFL YRIAPTALDT FASYTYAVFS DRMKDYEFGL VAFFTSLGAL AAPAAFGWAF 
GDASASGSSV GENDAGTLTK IRALLVSSPT WMMFVFGAVV DAALGLCRLF IVWRPPATGA 
VAALSIVNAL AIFGLRVGYM PIVTLGAIMA PQNLEAVGFA ALIFASDVGA LVSAYVSAGV 
VRALHIGAPT RTDTTGAVIP TDRSWSPLTA FLVLVAACKI IIPCVSAPPL LSSASRRSRA 
ADFSLLPADA DRSHATVDDA ARDSNASTRP SSPPFDLASP SAEL