Gene P9211_08451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_08451
Symbol
ID	5731334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	738116
End bp	740029
Gene Length	1914 bp
Protein Length	637 aa
Translation table	11
GC content	40%
IMG OID	641285209
Product	FtsH ATP-dependent protease-like protein
Protein accession	YP_001550730
Protein GI	159903386
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0508625
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00322552
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATCAGA GAGTAAAGCT AATACTTCTA TGGTTGCTGC CTATTGGGAT GGTTGTTCTT 
ATAAGCTGGC AAATACTAGG TAATGGAGAC ACAACTGCTC TAAATCAAAG CAGTAGCTCA 
CTTGCTACTA GAAACTCAGC TGTTTCAAAA ATGAGTTACG GGCGTTTTAT TGATTACATC 
AATGCAGGAA GAGTGACATC CGTTGATATT TATGAGGGTG GTCGTAATGC TGTAGTTGAA 
GCAATAGATC CAGAACTAGA CAACAGAGTT CAAAGAATAA GGGTTGATCT ACCAGGGCTA 
GCACCTGAAC TTATAAATAA ATTAAAAAGC GAAGGTATAA GCTTTGATGT TCATCCGCCA 
AGAACGGCCC CACCTGCTCT AGGAATAATA GGTAATCTTA TCTTCCCAAT ATTATTAATA 
GTAGGTCTAG TCTTTCTTGC TAGAAGATCC AATTCTATGC CTGGTGGACC AGGGCAGGCA 
ATGCAATTCG GCAAAACAAA GGCAAGATTT GCTATGGAAG CTGAAACTGG AGTCAAGTTT 
GACGATGTGG CCGGCGTTAA TGAAGCCAAG CAAGATTTAG AAGAGGTGGT GACCTTCTTG 
AAACAACCTG AACGTTTTAC TTCTGTAGGT GCTCAAATTC CTAAAGGTGT TCTTTTAGTG 
GGCCCTCCTG GAACAGGTAA AACTCTTCTA GCAAAGGCAA TAGCAGGAGA AGCAGGTGTA 
CCTTTCTTTT CTCTTTCAGG CTCAGAATTT GTTGAGATGT TTGTAGGAGT AGGAGCAAGT 
CGGGTAAGAG ACTTGTTTAA ACGTGCAAAA GAGAATAGTC CTTGCCTAAT ATTTATTGAT 
GAAATTGATG CTGTAGGGAG ACAAAGAGGA GCTGGAATCG GAGGTGGAAA TGACGAAAGG 
GAGCAAACTC TTAATCAATT ACTTACAGAA ATGGATGGAT TTGAAGGTAA CAGTGGAATC 
ATTATTATTG CAGCAACAAA TAGACCAGAC GTACTAGATT CAGCACTTAT GAGACCAGGG 
AGATTTGACA GGCAAGTATC TGTTGATGCT CCAGATATTA AAGGAAGACT TTCTATCTTA 
AAGGTACATT CTAGGAACAA GAAATTAGAC AAGGTACTTT CACTTGAAAA TATAGCTCGA 
AGGACACCAG GTTTTACAGG GGCAGATCTA GCGAACCTAC TAAATGAAGC GGCAATATTA 
ACTGCAAGAA GAAGAAAAGA TTTTATAGGT ATTACGGAAA TAGATGATGC CGTAGATAGA 
ATAATTGCTG GAATGGAAGG GCAGCCTCTC ACCGATGGAA GAAGCAAACG ACTGATTGCT 
TATCACGAAG TTGGCCATGC GCTTATTGGT ACTCTTGTGA AAGATCATGA CCCCGTGCAG 
AAGGTAACTC TTATACCAAG AGGTCAAGCA AAAGGACTGA CTTGGTTCTC TCCAGATGAT 
GACCAAATGT TAGTAAGTAA AGCACAACTA AAAGCTAGAA TCATGGGTGC TTTAGGAGGA 
AGAGCTGCAG AAGATGTGAT TTTCGGAAAT GCAGAAGTTA CAACTGGTGC AGGTGGGGAT 
ATTCAACAAG TTGCTTCAAT GGCCAGGCAA ATGGTAACCA AGTTTGGGAT GAGCGACTTA 
GGACCAATAT CATTGGAGAA TAGCTCTCAA GAAGTTTTTA TTGGCAGAGA CCTAATGACA 
AGAAGTGATA ATTCAGATGC TATTGCCAAG CAAATTGATG ATCAAGTTAG AGAGATAGTT 
AAAAAGTGTT ATAGAGAGAC ACTAGATATA GTAAATAATA ACAAAGCAGC AATGGATGGA 
TTAGTAGAGG TATTGGTTGA GAAAGAAACT ATAGATGGAG ATGAATTTAG GGAAATATTA 
TCAAATTATT GTGAGATACC AGACAAGAAA AATGTTGAGA ATATAGTCAT ATAG

Protein sequence

MNQRVKLILL WLLPIGMVVL ISWQILGNGD TTALNQSSSS LATRNSAVSK MSYGRFIDYI 
NAGRVTSVDI YEGGRNAVVE AIDPELDNRV QRIRVDLPGL APELINKLKS EGISFDVHPP 
RTAPPALGII GNLIFPILLI VGLVFLARRS NSMPGGPGQA MQFGKTKARF AMEAETGVKF 
DDVAGVNEAK QDLEEVVTFL KQPERFTSVG AQIPKGVLLV GPPGTGKTLL AKAIAGEAGV 
PFFSLSGSEF VEMFVGVGAS RVRDLFKRAK ENSPCLIFID EIDAVGRQRG AGIGGGNDER 
EQTLNQLLTE MDGFEGNSGI IIIAATNRPD VLDSALMRPG RFDRQVSVDA PDIKGRLSIL 
KVHSRNKKLD KVLSLENIAR RTPGFTGADL ANLLNEAAIL TARRRKDFIG ITEIDDAVDR 
IIAGMEGQPL TDGRSKRLIA YHEVGHALIG TLVKDHDPVQ KVTLIPRGQA KGLTWFSPDD 
DQMLVSKAQL KARIMGALGG RAAEDVIFGN AEVTTGAGGD IQQVASMARQ MVTKFGMSDL 
GPISLENSSQ EVFIGRDLMT RSDNSDAIAK QIDDQVREIV KKCYRETLDI VNNNKAAMDG 
LVEVLVEKET IDGDEFREIL SNYCEIPDKK NVENIVI