Gene OSTLU_13471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_13471
Symbol
ID	5006594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009374
Strand	-
Start bp	255611
End bp	257041
Gene Length	1431 bp
Protein Length	476 aa
Translation table
GC content	58%
IMG OID	640422015
Product	predicted protein
Protein accession	XP_001422694
Protein GI	145356967
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.155639
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.170565
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTTTG TTGACTTTTT GAAGAGTCCG AAGAAATACG AAGCCCTGGG CGCGAAAATT 
CCCCACGGCG CGCTTCTCGT CGGACCGCCG GGGACGGGAA AGACGCTTCT CGCGAAAGCC 
ACCGCGGGCG AGGCTGGGGT CCCGTTTCTT TCCATTTCTG GGTCGGATTT CATGGAGATG 
TTTGTCGGCG TCGGCCCGTC GCGAGTTCGC GATTTGTTTG CCCAAGCGCG TCAGCAGAAG 
CCGTCCATCA TTTTCATCGA CGAAATCGAC GCCATCGGTC GTCAACGTGG TCGCGGTGGC 
TTCGCAGGAG GCAACGATGA GCGCGAAAAC ACGTTGAATC AGCTTTTGGT TGAGATGGAC 
GGTTTCGGTA CCAAGGAGGG CGTCATCGTG TTGGCGGGTA CGAACAGACC GGATATTCTC 
GACAGGGCGC TCCTGCGTCC CGGTCGATTC GATCGTCAGA TCACCGTCGA TCGTCCCGAT 
ATTCAAGGTC GCGAACAAAT ATTCCGCGTG CATCTGGCCA AGATTGCCTT GGACGGACCA 
GTGGATCACT ACAGTGAACG TCTCGCCGCG TTGACGCCCG GCTTCGCCGG GGCGGACATC 
GCGAACATGT GCAACGAAGC TGCGCTCGCC GCGGCGCGTG ATAACATGAC CACGGTAACT 
CTCACACACT TCGAGTACGC CGCCGATCGC GTCATCGCGG GTTTGGAGAA GAAGTCGAAG 
GTTGTGAACA AGACGGAGCG TCGCACGGTG GCGTATCACG AAGCCGGACA CGCCGTCGTG 
GGGTGGTTTT TGGAACACGC TGAGCCTTTG CTCAAAGTGT CCATCGTTCC GCGCGGTTCC 
GCGGCTCTAG GCTTCGCGCA GTATCTGCCG AACGAGAACC TTCTCGCCAC GACGCAGCAG 
CTGATCGATA TGATGTGCAT GACGCTCGGA GGCCGCGCCG CGGAGCAAGT CATGCTCGGA 
AAGATTTCCA CCGGGGCGCA AAACGATTTG GAAAAGGTCA CGCAAATGGC GTACAACACC 
GTGGCCGTGT ATGGCATGAA CGAGAAGATC GGGTTGCTTT CGTTCCCCAA AGACGAGCAA 
AGCTTGAAGT CGCCGTATTC TGAGGACACG GCGAGAATGA TCGATGAAGA GGTTCGCCTG 
CTCGTCGACA CCGCGTACAA GCGCACGTTG GCGCTCGTGA AGGAGAAGAA GCACCTCGTC 
GAAGCCATGG CGCAAGGCTT ACTCGACAAG GAGGTTTTGC AGCGCCACGA TTTAGTTAAA 
CTTCTCGGCG ATCGACCCTT CGTGTCTGAA AACCCGCAAA ACATTGATAT TTTGAACGAA 
GGCTTCAAAA TGCACTATCC GAAGACGGCA ACGGCGCCAG AGGACGAACC CGCGGATACG 
GACGAGCCGG AGGACGACGA GCCCAGTCCG GCGTTTCCAC TCGCGACTTA A

Protein sequence

MEFVDFLKSP KKYEALGAKI PHGALLVGPP GTGKTLLAKA TAGEAGVPFL SISGSDFMEM 
FVGVGPSRVR DLFAQARQQK PSIIFIDEID AIGRQRGRGG FAGGNDEREN TLNQLLVEMD 
GFGTKEGVIV LAGTNRPDIL DRALLRPGRF DRQITVDRPD IQGREQIFRV HLAKIALDGP 
VDHYSERLAA LTPGFAGADI ANMCNEAALA AARDNMTTVT LTHFEYAADR VIAGLEKKSK 
VVNKTERRTV AYHEAGHAVV GWFLEHAEPL LKVSIVPRGS AALGFAQYLP NENLLATTQQ 
LIDMMCMTLG GRAAEQVMLG KISTGAQNDL EKVTQMAYNT VAVYGMNEKI GLLSFPKDEQ 
SLKSPYSEDT ARMIDEEVRL LVDTAYKRTL ALVKEKKHLV EAMAQGLLDK EVLQRHDLVK 
LLGDRPFVSE NPQNIDILNE GFKMHYPKTA TAPEDEPADT DEPEDDEPSP AFPLAT