Gene OSTLU_24766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_24766
Symbol
ID	5002680
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009361
Strand	-
Start bp	165391
End bp	168284
Gene Length	2894 bp
Protein Length	365 aa
Translation table
GC content	61%
IMG OID	640418101
Product	F-ATPase family transporter: protons (chloroplast)
Protein accession	XP_001418858
Protein GI	145348854
COG category	[C] Energy production and conversion
COG ID	[COG0224] F0F1-type ATP synthase, gamma subunit
TIGRFAM ID	[TIGR01146] ATP synthase, F1 gamma subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.057416
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.404649
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GAACGATCGA CTCGATGTCC GCCGTCGCCC ACACGTCGCT CGCCATGAGC AAGGCCACCG 
CCGTGCGCGG TGCGTCCGTG AAACGGTCCA CCGCCGCGCA GCGCGCGACG GCGCCGCAGC 
GATCCCTCGT GGTGCGTGAA CGACGAACGA CGCGACGCGC GAACGACGCG ATGGCGCGCG 
ATGGGACGGG CATCGGGATT ATCGCGCCGC GCGCGAGGAC GCGCGCGCGG GCGAGGATGA 
TCGCGCGCGG GATTCGGTGG AGGAAAATAG TGCGCGAGAG ATGGCGTCGC GGGGCGACGC 
GCGCGCGCGC GAGGGACGCG CGGCCGGGCC CGGTCGTGGA CGTAGGGTCT GGTGAGGATA 
ACGCGGATCG GATCGCGGCG TCATCGGGAG GGCGCGGGCG ATGGCGACGC GCGTCGGGGG 
GCGCGCGTGC GCGCGGGGGC GCGCGGGGGT TGTGTGGTGA TCGCGCGCGC GATCGGGGGG 
CGCGGCGCGC GGCGTGCGCG CGCGCGTGGG CGCGGGCGGG GGCGGGACGA TCGTATCCAA 
AGAGGGTTTT GCGCGCGCGC GAGACCGACG CGAGACGCGA GAGACTGACG GTGATTCGTA 
CGCTTTATGA CGATTCGTAG ATTCGCAACG CGAGCCCGAA GGAAATGCGC GACCGCATCG 
CGTCGGTCGG TAACACGAAG AAGATCACCG ATGCGATGAA GCTCGTCGCG GCGGCGAAGG 
TGCGCAAGGC GCAAGACGCC GTCATTGGCG CGCGCCCGTT CTCTGAGTCT TTGGTCAAGG 
TTTTGTTCGC CATCAACAGC CGATTGGCTG GTGAGGATGT GGACGTGCCG TTGACGAAGA 
TGCGCCCGGT GAAGACGGCG ATGCTCGTCG TCTGCACGGG TGATCGTGGT TTGTGCGGGG 
GGTTCAACAA CTTCATTATT CGCAAGACGG AGCAGCGCGT GGCGGAGCTC AAGGCGCAAG 
GCGTTGAATG CAAGCTCATC ACCGTCGGTA AGAAGGGTGG TGTGTACTTC AACCGTCGCA 
AGGAGCAATA CAACTTGGTC AAGCGCTTCG ACATGGGTCA AGCGCCGTCC ACGCAAGACG 
CGCAAACCAT CGCCGACGAA ATCTTCGCCG AGTTCACCTC GGAGGAAGTC GACAAGGTCG 
AGATGATTTA CTCCCGATTC GTTTCCCTCA TCGCTGCGGA GCCGACCGTG CAAACCATTT 
TGCCGCTCTC CAAGGAAGGT GAGGTGTGCA ACGTTGACGG TGTTTGCATT GACGCGGCGA 
ACGATGAAAT CTTCAAGCTC ACGACTGAAG ATGGCAAGTT CGCCGTCAAG CGCGAAGCGT 
CTGACACGGA GGTTTCTGAG TTTGAGGGTG TCATGCAGTT CGAGCAAGAC CCGAACCAAA 
TTCTTGATGC CCTCATGCCG CTGTACATGA ACTCCCAAAT CCTCCGTGCG CTCCAAGAGT 
CTCTCGCCTC TGAGCTCGCG GCGCGCATGA ACGCGATGTC CACCGCCTCG GACAACGCCA 
AGGAGCTCAA GAAGACCTTG TCTTTGGTTT ACAACCGCGC TCGCCAAGCG AAGATTACCT 
CGGAAATTAT CGAGCTCGTC GCCGGTGCCT CCGCCGCGTA AGCCACCGAC CATTCATTTC 
CTTAGAAGGG ATTGTTTGTT TCGTTCGCCG GTTTCCGCGC GCGCGAACGC ACTAGAAGCG 
CCTGTCTGCG CCCGATTTCT CACGCGCGCC GCCGCGGCGC GAGCGTCCAT CGCCTCGATC 
ATCGCTCGCG CCCGACGCGT CTGTCGAATC AGTCGCGCGA CACTTAGCAC ATAATCACTA 
TTGCAATCAG CAGTTTGAAC CAACTCTGAA TCCTCGCCTT CGCAGTCAAA ATAAGTGCGA 
CCGACCGCCG ATCGGCACGT TACGATCGAG CCCTCTCGCT CGATCGCCAC ACGGTGCCTC 
GCATCGCTCG ACCGCGCGCG TCGTCGCGAA TCACCAACAA TGCGCGCCAG CGTCGACGCC 
GCGCGCGCTC GCGCGCCGAC GCCATCGCGC GCGCGGCGCG GCGGCGACCG CAAACGTCGA 
ACACCTCCGG TGACGATTCT CGCCGCCGCG CGCGGTAACG TCCGCGTCGA CGCCATGGCG 
ATCGGCGGTG GACACACCCA TCATCATAAT CACCACCACG ACCACGGACA CGGGTGGTTC 
AAGTCGCGCG CGGCGCGCGA TTTGGAGAAG TGGCACAAGA CGCAAGAGGG ACGCGCGGCG 
TTGGAATTGG CGGATCGAGA GACGCGCGGC GCGGCGTCGA CGAAGGCGCT CCAGATGGTG 
AAAGATCACG TCGCGAACGA AGCGCCGAAA CCGGATACGC TGGTGCACCA CGCGCAGCCG 
CATGAAATCG ACCAGACGAC GCGATGGGTC ATCGCGACGT TTTTGAACCG GTTGATTCAC 
GTGCCGATGA TGAATCCGAT GACGGAACAA ATCATCTGCG TCAAGGCGGT CGACTGCATC 
GCTGACGCTA TCGAGCGCGA GCTGCGCCGC ACTGGCGCGG GTCACTTTTT TAACGACGCC 
GTGGAGCACG AACGGCGAGG TGACCTCGAG GAGTGGTTGA ACAACGTGTG CGACGATTTG 
AACTTGGTCA TAGACGTGCC GATGTTGGAC GAAAGGCAAG AATTTGATTG TATTCACGCC 
GTGATGTCGA TCGTGACGCA TCAATACTTG GAAGCAAAGA AGAGGGACGA AAAAGACAAT 
CCAATCAAGC ACAAGTGGAT TTTGCTTGTG AACATGCTCG GCTAAACGAT GTGTGTATGT 
ATGTGGCTGA CGCACACGAA AGATAGCTGT AAAATAAGTT GAACCCACTA ACCGGCGCGA 
GAATTAGCGT GTATTTAACC TATGTGATAT CACATAGGTT ATTATCAATA ATAAGAGTGT 
CATAATCTAC ATCC

Protein sequence

MSAVAHTSLA MSKATAVRGA SVKRSTAAQR ATAPQRSLVI RNASPKEMRD RIASVGNTKK 
ITDAMKLVAA AKVRKAQDAV IGARPFSESL VKVLFAINSR LAGEDVDVPL TKMRPVKTAM 
LVVCTGDRGL CGGFNNFIIR KTEQRVAELK AQGVECKLIT VGKKGGVYFN RRKEQYNLVK 
RFDMGQAPST QDAQTIADEI FAEFTSEEVD KVEMIYSRFV SLIAAEPTVQ TILPLSKEGE 
VCNVDGVCID AANDEIFKLT TEDGKFAVKR EASDTEVSEF EGVMQFEQDP NQILDALMPL 
YMNSQILRAL QESLASELAA RMNAMSTASD NAKELKKTLS LVYNRARQAK ITSEIIELVA 
GASAA