Gene OSTLU_19257 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_19257
Symbol
ID	5006908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009375
Strand	-
Start bp	246279
End bp	247430
Gene Length	1152 bp
Protein Length	383 aa
Translation table
GC content	58%
IMG OID	640422329
Product	predicted protein
Protein accession	XP_001422938
Protein GI	145357463
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.000016644
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0048219
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGCGGCG TGAGCGCGTC CAAGGAGGAC GTGCACGCGG CGATAAAGAA GGTGGACAAG 
GGATTGTTCC CGAAGGCGTT CTGTAAGATC GTGGAGGACA TCGCTGGGGA CGAGGCGTAC 
TGCACGTGCA TGCACGCGGA CGGCGCGGGG ACGAAGACGA GCCTGGCGTA CGCGTACTGG 
AGAGAGACGG GAGATTTGGG AGTGTGGCGA GGAATCGCGC AGGATTCGAT CGTGATGAAC 
ACGGATGATT TGTTGTGCGT CGGGTGCGTG GATAACATAT TCGTCTCGAG CACGATCGGG 
AGGAATAAGG CTTTGATTCC GGGGGAGGTG CTGAGCGCGC TCATCAACGG GACGGAGGAG 
GTTTTGGAGA CTTTGCGCGA GTGTGGGGTC GGGGTGAAGT CCACGGGAGG TGAAACCGCG 
GATTTGGGTG ATTTAGTGCG CACGGTGGTG GTGGACACCA CGGTCACGGC GCGCATGCGA 
AGAGACGCGG TGGTGAGTAA CGACAACATT CGCGCCGGAG ACGTCGTCGT CGGTTTGGCG 
TCGTTCGGTC AAGCGACGTA CGAGAGCGAG TACAACGGCG GAATGGGAAG CAACGGATTG 
ACGTCTGCTC GACACGACGT GTTTGCGAAG AATTTGGCGG AAAAATATCC GGAAACGTTC 
GATCCGAACG TACCCGAATC GTTGGTGTAC AGCGGCAAGT ATCAGCTCAC CGACGTCGAG 
CCGGAAACCG GCGTGACGGT TGGCAAGTTG GTGCTCAGTC CGACGCGAAC GTACGCCCCC 
GTGGTGAAAG CCGTGCTCGA TGCCATGGAC GTGAGGGATA TTCACGGCAT GGTGCACTGC 
AGCGGCGGCG CGCAGTCCAA GGTTGGACAC TTTCTCCTCG ACGGCTTGCG CGTCGTCAAG 
GATAACATGT TCCCCATTCC CCCGCTCTTC CGCTTGATCC AGGAGTGCTC CAACACCGAA 
TGGAGCGAGA TGTACAAAGT GTTCAACTGC GGACATCGTC TCGAGTTTTA CTGCTCCCCC 
GAACACGCGC AAAAGATTAT CGATATTAGC CAGAGCTTTA ACATCGACGC CCGCGTCGTC 
GGCAGAGTCG AAGCCAAGGA TGGCAAGTCT GAAGTCGTGG TGAAGAGTGA ATACGGTGAG 
TTTACGTATT AA

Protein sequence

MRGVSASKED VHAAIKKVDK GLFPKAFCKI VEDIAGDEAY CTCMHADGAG TKTSLAYAYW 
RETGDLGVWR GIAQDSIVMN TDDLLCVGCV DNIFVSSTIG RNKALIPGEV LSALINGTEE 
VLETLRECGV GVKSTGGETA DLGDLVRTVV VDTTVTARMR RDAVVSNDNI RAGDVVVGLA 
SFGQATYESE YNGGMGSNGL TSARHDVFAK NLAEKYPETF DPNVPESLVY SGKYQLTDVE 
PETGVTVGKL VLSPTRTYAP VVKAVLDAMD VRDIHGMVHC SGGAQSKVGH FLLDGLRVVK 
DNMFPIPPLF RLIQECSNTE WSEMYKVFNC GHRLEFYCSP EHAQKIIDIS QSFNIDARVV 
GRVEAKDGKS EVVVKSEYGE FTY