Gene OSTLU_43023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_43023
Symbol
ID	5005558
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	+
Start bp	35412
End bp	36818
Gene Length	1407 bp
Protein Length	451 aa
Translation table
GC content	55%
IMG OID	640420979
Product	predicted protein
Protein accession	XP_001421190
Protein GI	145353802
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.583618
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCTTA CGTTGGCGCT GCGCGGCGCG TCGTGCGACG CGCGCGCGAC GTCGTCGCGC 
AAACTGCTGC GACGCGAACC CGCCGGCGCG TCCAGGCCGG TCCATCGCGA ACACCTGTCG 
TCTGGGGTGT CCAAGGAGCT CGTGCAAAGA GTCGCGCGCC GGGACGGCGG CGTCGCGGTG 
ACGTTTGCGA ACGAAGGCAT GTACGACTTC GTGGTGAACT GGTGCGAACA CATGGACGAA 
ATCGGGATTA CGAATTATTT AGTCGGGGCG ATGGATGAGA GCTTATACGG TCGGTTGCGA 
AAGATTGGCG TCAACGCGTG GTTGATGGGA TCGAAAAATA TCGACGACGA CGAAGTGAAG 
AAGGATTTCG GTTGGGGGAC GAGGACGTTT CATAAGATGG GACGGGATAA GATTCGTTTA 
GTGCACGAGC TGACGAAGAC TGGGTTTGAT GTCATCGTCA CGGACGTAGA TGCGGTGTGG 
TTACGCGACC CATTTCCGTT TTTGAGGCGA TATCCCAAAG CGGATGCGTT GGTGAGCATC 
GATAATTTGC GCAATCATAC CTCGGTCGTG GCGACGCAAG CGAATCACGC GGTCGATGGG 
GAAGGCTTAG AGCACAGCGC GTGCGGTGGG AACAAAAACA TCGGTATTAT GTGGTTTCGC 
TCGACCGAAG GCAGTCAGTC GTTCACGCAA GAGTGGTTGA ACAAGCTCGA GTCAAATGAC 
AAAGATTGGG ATCAAGTCGT GTTTAACAAG TTGGTCGAGC AGGGCGGGTG CGAAACGGCG 
CGCGACGGGA GCGGTGTCGC CCCGGCGTAT GGTGGCGGGC TCATGCTAGG AATCTTGCCG 
GTGGCGTTCT TTGCGAACGG TTACACATAT TTCACCGAAC GTCTTCACGA AATGTTCGGC 
TTGAAACCGT ACGCTGTGCA CACGACGTTT GGTTACGCAG GCACGGTTGG GAAGCGACAT 
CGCCTGCGAG AGGCGAACCA GTGGTACGGC GATAAATACG AACCGACTTA TTTTCAAGGG 
AAATTCATGT CGTACACGCC GCGGCTGCTC AAAGATGTCG ATTACGCCGA ATTCGTCAAG 
CGTGGCCACC CGAATGAAGA AAATACACCC ATGCTCGAGA GAGACGAGGA CGTTGTGTTG 
GAGCACATGC GATTCGTCAA TCATCAACTC GCGCAATTGT ACGAAGCTGC GGTCGTCGCG 
AAGCATCTTG GACGTGCGTT GATTTTACCG CCATTTGCGT GCGGGTTAGA TCGCGTTTGG 
TTCCCTCACA AAGGGCGATA TCCCGGTGCT TTGCTCAAGC TTCCATTCGT GTGCCCTGCG 
GATCACGTGC TCAAGATTGA AGAGTTGCAC GAATTCGCGC AAGACTATCG CGAATTTTCG 
TTTTTAGGGC ATCCTTACAT GCCGCGT

Protein sequence

MALTLALRGA SCDARATSSR KLLRREPAGA SRPVHREHLS SGVSKELVQR VARRDGGVAV 
TFANEGMYDF VVNWCEHMDE IGITNYLVGA MDESLYGRLR KIGVNAWLMG SKNIDDDEVK 
KDFGWGTRTF HKMGRDKIRL VHELTKTGFD VIVTDVDAVW LRDPFPFLRR YPKADALVSI 
DNLRNHTSVV ATQANHAVDG EGLEHSACGG NKNIGIMWFR STEGSQSFTQ EWLNKLESND 
KDWDQVVFNK LVEQGGCETA RDGSGVAPAY GGGLMLGILP VAFFANGYTY FTERLHEMFG 
LKPYAVHTTF GYAGTVGKRH RLREANQWYG DKYEPTYFQG KFMSYTPRLL KDVDYAEFDV 
VLEHMRFVNH QLAQLYEAAV VAKHLGRALI LPPFACGLDR VWFPHKGRYP GALLKLPFVC 
PADHVLKIEE LHEFAQDYRE FSFLGHPYMP R