Gene OSTLU_32267 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_32267
Symbol
ID	5002211
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009360
Strand	+
Start bp	554827
End bp	556749
Gene Length	1923 bp
Protein Length	640 aa
Translation table
GC content	63%
IMG OID	640417632
Product	predicted protein
Protein accession	XP_001418274
Protein GI	145347647
COG category	[S] Function unknown
COG ID	[COG4886] Leucine-rich repeat (LRR) protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.466679
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGGC CCGCGGACGC GCGCGACGCG GTCTCGAGCG CGGTGCTCGC GGTGCTGCGC 
GCGCCGTGCG ACGCGTACGC GAAATCGTTC GACGATGAAA CCGCGGCGTC GCTGCGCGCG 
GGAGCGCGAC GAGCGCTCGA GGCGCAGTGC GCGCGCGCAG GCGGGGACGA GACGCGGAGC 
GACGCGTGCG GGACGCTCGC GACGGTGGCG GACGGCGCGC GCGCGATGAC GCGAGGAGAG 
GCGATGGGAC ACTTTAAGCA AGCGATGCAC GAGAGCTGTC AATCGGGGGC GGCGGCGATG 
TCGGATCCGG AGAAGCGGGA CGCGAGTGAG GCGACGCGGT ACGTGCGCGA GGCGGTGACG 
CGCGCGGCGG AGGAGGAAGC GGTGGCGGGA CGCACGGCGA GCGCGGGGAG ATGGGAGGAC 
GACGGGGGCG AGGGAACGTC GCCGGCGACG TCGGTGACGG AGGAAGGCGG CGACGGGCGC 
ACGGGTGATC GTGGAATGTG GGGATGGGAT CGAGACGCGC CGACTCAAAC GTCGGCGGAG 
GACGCGTTCG GGGCGGCGTC GAGCGTGGAT TCGATCAAGC ATCGCGAGCG ACAGGCGTTG 
GGTGACATGT ACAGGCGTAC GAACGGTGCG AAATGGCGCA GACGGGACGG TTGGATGTCC 
AGCAAGTCTT ACTGCGAGTG GTACGGGGTG ACGTGTCTCG AAAAGGATTT CGGCGTCGCC 
TTTGTGGATT TGCGAGACAA CGGCATGGAG GGCGACATGC CGCAAGCGAT CGATGAATTG 
AAGCTTTTAC AAGGACTGGA CCTGTCGTAT AATCGGCTCG AAGGACGTTT GAGCGCGATG 
CTCGGTGAGC TGAAGACGCT GCGGTACCTC TTGGTACGAT CGAACGCGCT GTATTCCGAC 
ATTCCCGCCG GCTTGTTTAG GAAAGGCTCG CCGTTGACGC AGCTGGACCT GAGCGACAAT 
TCTTTGTCTG GGGCGATTCC TGGACGCGAG TTTGTGTACT TGACAAGCTT GCGTATGTTC 
AATGTGTCAA ACAACGCGCT CACGGGTACG ATTCCGAACA TCGCCTCGCT CCCAGCGTTG 
GAGATATTTT CGGCATCCAC CAACGCGCTG CGTGGCGCTG TGCCTCACTT TGACGACGCC 
GCCAAGATTC GTTTCTTCGA CGTGAGCAAG AATGCATTAC ATGGTTCGAT TCCATCGCTT 
TCATCCGTAC CGTCCTGGGT GTTGTTTGAC GTCTCCCACA ACTCCCTCAC CGGCGAGCTC 
CCGCGGACAG CGCTTCCGCG AACGCTTCGC GTGTTCTCGT GCGCCAACAA CAACCTGAAT 
GGCACCGTGC CGCAAACGTT CGCTCAGCTG CCCAAGGTGG AGCACTTGGA CTTTTCGGCG 
AATCAATTCA CCGGCGCGTT ACCCGCGAGC GTGTTGCAAA AAAAGACGCT GCGATACTTC 
AACGTCTCGC GGAACGCGTT CGAAGGCGAA CTTCCGCGCT CGGTGTACCA AGGCGAACTC 
GAGCGTCAAT CCATGAGACT GGAGGAATTT GACGTCAGTC ACAACAAACT CACGGGTGCG 
CTGCCGCAGT CAATCGTCGA GTTGGACCGC CTTCGTGTCA TCGACGTCGC GCACAACGCG 
CTGAGCGGCG ATTTACCTTC GCGTTGGGCC GTCGACCGCC TCGAGCGTCT CGACGTCAAA 
GCCAACGCGT TCACGGGCGC CATCCCCACC ATCCTCGCCA GAGCCACGCG CCTGCGCCAC 
CTCGATTTGA GTCAAAACGC CCTCAGATCT CGCGCCAACT TAGCCGTGCT CACGATCCCC 
ACCCTCGAGC ACTTGGACGT CTCCGGAAAC TCGCTCGATT GGAACGAAGC CGCCGCCGCG 
CCGGCGCCGA AAATCGACCG AGCGCGCGCC ATCGAACCCC CTTCGCTTCA CGACGACCTC 
TGA

Protein sequence

MARPADARDA VSSAVLAVLR APCDAYAKSF DDETAASLRA GARRALEAQC ARAGGDETRS 
DACGTLATVA DGARAMTRGE AMGHFKQAMH ESCQSGAAAM SDPEKRDASE ATRYVREAVT 
RAAEEEAVAG RTASAGRWED DGGEGTSPAT SVTEEGGDGR TGDRGMWGWD RDAPTQTSAE 
DAFGAASSVD SIKHRERQAL GDMYRRTNGA KWRRRDGWMS SKSYCEWYGV TCLEKDFGVA 
FVDLRDNGME GDMPQAIDEL KLLQGLDLSY NRLEGRLSAM LGELKTLRYL LVRSNALYSD 
IPAGLFRKGS PLTQLDLSDN SLSGAIPGRE FVYLTSLRMF NVSNNALTGT IPNIASLPAL 
EIFSASTNAL RGAVPHFDDA AKIRFFDVSK NALHGSIPSL SSVPSWVLFD VSHNSLTGEL 
PRTALPRTLR VFSCANNNLN GTVPQTFAQL PKVEHLDFSA NQFTGALPAS VLQKKTLRYF 
NVSRNAFEGE LPRSVYQGEL ERQSMRLEEF DVSHNKLTGA LPQSIVELDR LRVIDVAHNA 
LSGDLPSRWA VDRLERLDVK ANAFTGAIPT ILARATRLRH LDLSQNALRS RANLAVLTIP 
TLEHLDVSGN SLDWNEAAAA PAPKIDRARA IEPPSLHDDL