Gene OSTLU_18661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_18661
Symbol
ID	5006154
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009371
Strand	-
Start bp	91586
End bp	92794
Gene Length	1209 bp
Protein Length	402 aa
Translation table
GC content	60%
IMG OID	640421575
Product	predicted protein
Protein accession	XP_001422199
Protein GI	145355932
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0495806
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGTTG AGCGCGGCGA CGCCGAACCG CTCCTGCGCG CGTCTCGCGA CGTCGAGCGC 
GCGTCGGACG ACGCGGAGAC GACGGCGGCG AAGCTCGCGG TCGATCGAAC GCGCGGCGCG 
GCGAGCGCGA GGCTGGTCGT CGGCGCGTGC GCGGTCGCGG CGTGCCTCGT CGGGGCGAGC 
GCGAGGGCGG ATTGGGCGCA CCGACGCGGC GGCGCGCTCG CGGAACGCGA GGAAGTCGAG 
GCGTTCGGAC GGGAATTGAA CGTCGGTGAT CTGAGTAAAT ATTACGAGAT TCCGAGGAAG 
GCGAAGTCGG TGAAGCAGAC GCACGCGAAT CGAGTGCTGT TTTACAACTT TTTGCACGTG 
CCGAAGACGG GTGGGACGTT TTTTCACTCG GTGTTGCGAC AGGTGGAACG CAGGGTGAAT 
CGTAAGCCGA AGCAGGAGGC GTTCCTGGGC GAAGAATTAT TTCCTCACGA TCATGAGTCG 
ATCGCGCAGT GGATCACGTG GCCTTTGGTC GATACGACGA GAGAAAATTA CGCGGCGACG 
CGGCGGCACT TTGCCACGGG CGAACCCGCG GAGTACTTTG GCGTGGATCG TTTGCGGAAG 
ATGTATGAAT CAGGGGCGCG GATTTTTAGC AAAGGCTCCT ACGGCATGGG ACTGTGCGAG 
GTCGTTGACG CCCCGTGTGC GTACATCACA ATCTTAAGAG ACCCAGTCGA GCGGTTTTTA 
AGTCACTACA AGTACTCGTG CTTGGCCGGG GCTGAAAATC GTCGGCTGTG GAACAAGGCG 
ATGAAGGACA AGGGCGAGTG CGCCATGAAC CTCGTAGAGT GGCACGATTA CTTGGGCGGT 
GATAATTGGT TGCACGTCCT CGCACCGGGC GGTGGGGAGA ACAAAGACGC TCAAGTCGCT 
GCGGCGATCG CGAATTTGGA CGACCCGTGC TTTAAATTTC TGTTGACGGA GAAACTCGAC 
GACGGTTTAG AAAAGCTCAC AACTTTACCC GATTTTGCGC GGCTCAACGC GACGCTTTTA 
GCCAATTTTG CGCAGCACAA CGAAGCGCCC GAGCTCGATG CGCACCAGCA GCGCCTCTAC 
GACAGGCACG TGGCGAACGA AGACATGATG GCGCATTTGC GTCGCAACCT GCGCAAGTCG 
CTCGCCGTGT ACGCGCACGC GAAGAGAACG TACGAGCGCA AGTGGCGGCA GCGCCTTCTT 
TCGTGTTGA

Protein sequence

MGVERGDAEP LLRASRDVER ASDDAETTAA KLAVDRTRGA ASARLVVGAC AVAACLVGAS 
ARADWAHRRG GALAEREEVE AFGRELNVGD LSKYYEIPRK AKSVKQTHAN RVLFYNFLHV 
PKTGGTFFHS VLRQVERRVN RKPKQEAFLG EELFPHDHES IAQWITWPLV DTTRENYAAT 
RRHFATGEPA EYFGVDRLRK MYESGARIFS KGSYGMGLCE VVDAPCAYIT ILRDPVERFL 
SHYKYSCLAG AENRRLWNKA MKDKGECAMN LVEWHDYLGG DNWLHVLAPG GGENKDAQVA 
AAIANLDDPC FKFLLTEKLD DGLEKLTTLP DFARLNATLL ANFAQHNEAP ELDAHQQRLY 
DRHVANEDMM AHLRRNLRKS LAVYAHAKRT YERKWRQRLL SC