Gene OSTLU_16823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_16823
Symbol
ID	5003806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	-
Start bp	425003
End bp	426430
Gene Length	1428 bp
Protein Length	475 aa
Translation table
GC content	61%
IMG OID	640419227
Product	predicted protein
Protein accession	XP_001419804
Protein GI	145350840
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0199026
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTGA GGGCGTTGGC GCGGGCGTTT CACGATTCCG CTCGCGCGCG ATTCGACGCG 
CCGGCGACTA CGTTGCTGCG CGCGGCGGCG GCGCGGATCG AACGCGAGCG GGAAGCTTCG 
ACGGCGGCGA GGGACGTGAC GAGCGCGATT TGGGGCGTGG AGAACTATTG GCGGCGGCGG 
GACGTGCGCG AGGACTCGGA GGATATGCGG GCGCTTCGAG AGTTTGCGCG CGTCGCGAGC 
GCCGCGGCGG CGAGCGTCTT CGTCGAGTGG GATTCGGCCA AGGACAAGCG AGGGGCGGCG 
ACGCTGTGTC GGGCGCTGAA GCACGTGATC GCGATTCATA AAATCACGGG CGAGCCCGTG 
CCGATGGATT TCATCGCCTC GCTCGTGAAC GTGGCGTCGC ATAACGCGGT GGCATTTTCG 
CCGATGCAAG TGTCGTTCAT CTTGCACGAC GTTGTCTCGG CGAAGGCGAC GGATATTTTA 
ACGGAGCGAG TCATCGCATC ATTCTCACAC ATCATGCAAG TCGACGAATC GACGCCCTTT 
GCGGCTGTTT CAGCGCTGTT GTGGAGCTAC GCGAAGATGG ACGCGTTGAA GAGCGGTTTG 
GTGTCGACGA AGCACACGGA TGAGTTGCAC TTTGTCACTC GCGCAAAACT CGATCGTGGC 
GAAAAAGTGG CTTCGCGCGA TATCGCGATG AATATGTACG CCGTCGCCAG GCTCGGTGCC 
GAACACGTCG GTTTTGCCGA TGGCGATTAC CACGACGTGG CGTGCAAGAC GCTGGCGAAA 
GAAATCGACA CCCTCAACCA ACGCGCTCTT CTAATGATTG CGTGGTCGTT GAACACCATG 
CGACCGAGCG AGGATAACGT ATACATTCAT TCAACGTTTC TTGACGCGCT GGGCGGTGCG 
GTTCAGCGGT CTGTGCACGC GTTCGCGCCT TTCGAGTTGG CGCCGACGAT GCACGCGCTC 
ACGTCGCTTC GCGTGACGAA TCCAAAGCTC TTGGAACTCG CGCGAGACAG GTTTCGCGCC 
GACGTTTCGG GTTACGCGGA GAAGCCTCAA AACCTCACGT TAATGCTTTG GTCGTTCGCG 
GCGGCGGAGT ACGATATCGG TGAAGACACC TCGCGCATGG CCGCGTACGC GTACCTCGAC 
GTCGCGCCGA TCGCTTCCGC GCTCGAGACG AAAACCATCC TTCAATCTCT GGCGCGTCTG 
CACTTCGTCT TCGACGAAGA CGACGCGCGC GTGAAGAACA TATTAGATGA CGTCATCGAA 
CGATATTTGG ACGAGTACTC CGAGGCAGAC TGCGAGGTGC TCGCGTGGAG TCTACTCGCC 
CTTCGCGTTC CGGCGAGCGA GCGGTTGCTC GAGCGCGTCG GAGTCGAGTC CGTCGCCAAC 
GACGCCGGTG ACGTCGAGTA CGTCGTGCAC AAACCAATCG ACGTGTGA

Protein sequence

MSLRALARAF HDSARARFDA PATTLLRAAA ARIEREREAS TAARDVTSAI WGVENYWRRR 
DVREDSEDMR ALREFARVAS AAAASVFVEW DSAKDKRGAA TLCRALKHVI AIHKITGEPV 
PMDFIASLVN VASHNAVAFS PMQVSFILHD VVSAKATDIL TERVIASFSH IMQVDESTPF 
AAVSALLWSY AKMDALKSGL VSTKHTDELH FVTRAKLDRG EKVASRDIAM NMYAVARLGA 
EHVGFADGDY HDVACKTLAK EIDTLNQRAL LMIAWSLNTM RPSEDNVYIH STFLDALGGA 
VQRSVHAFAP FELAPTMHAL TSLRVTNPKL LELARDRFRA DVSGYAEKPQ NLTLMLWSFA 
AAEYDIGEDT SRMAAYAYLD VAPIASALET KTILQSLARL HFVFDEDDAR VKNILDDVIE 
RYLDEYSEAD CEVLAWSLLA LRVPASERLL ERVGVESVAN DAGDVEYVVH KPIDV