Gene P9211_03601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_03601
Symbol
ID	5731843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	337571
End bp	338881
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	41%
IMG OID	641284709
Product	carboxyl-terminal protease
Protein accession	YP_001550245
Protein GI	159902901
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTCAA CTGTTAAAAC CTTGTCAAAA TTTCTCCACA AAATTCTTTG CGCTTTTCTA 
AGCTTTTGCA TGATTTTTCT AGTCACTGCA AGGCCTCTCT ACGCATTGAG CGACGGTCAA 
CAACTAGTAC TAGAGGCCTG GAATATCGTT AACGAAGGGT TTTTAAATCA AGAAAAATTC 
AACGAGGTTC AATGGAAACG CCTTAGGAAA AAGGCACTGG AAGAAGAAAT TACGACATCA 
ACTGAAGCTT ATAATGCTAT TGAAGGCATG CTTGCCCCAC TCGGAGATCC ATATACAAGA 
CTCTTAAGGC CAAAAGATTA CGCAGCAATG AAGGAAAGTA ATCTTGGGAG TGAGATAAAT 
GGTGTAGGTC TTCAGTTAGG CGCAAGAAAT ATCGATGGGA AGATTGTTGT AATTTGCCCG 
CTTGAAGATT CCCCTGCAGC TGATGCCGAA ATTCTCAGTG GATCAATTCT TATAAAAGTC 
GATAACGAAT CACCTCAAAG CCTTGGATTA GAAGCTACAG CAGCGAAGCT AAGAGGAGAG 
AGTGGAAGCA AAGTGATTAT TGAATTAGAA ACTCCTGATG GAGAACAGAA AGAAATCAAC 
CTTGAACGTC GCAGTGTTGA TTTAAGACCA GTAAGAAGCA AGAGAATACG CAATGAACTT 
CATACACTTG GATACTTAAG AATTACTCAA TTTAGTGAAG GAGTGCCAGA TCAAGTCCGC 
GAAGCCTTAG CAGAACTAAA AGAGAAAGGT GTAGAAGGTT TAATTTTAGA TTTAAGGAAT 
AACTCTGGTG GTCTTGTAAG TTCAGGTCTT GCAGTCGCCG ATGCTTTCTT AAGCAATCAA 
CCAGTTGTTG AAACTAAAAA TAGAAATGAA ATTAGTGAAC CAATCCCTTC CAATGAGGGA 
ACCTTTTACG ATGGTCCAAT GGTAACTCTT GTAAATGCAG GGACCGCTAG TGCAAGTGAG 
ATTCTTGCAG GAGCCCTTCA AGATAATTCA CGCTCAGAAT TGGTCGGCGG CAAAACCTTT 
GGGAAAGGTC TAATCCAAAC TCTTACAAAC TTAAGCGATG GGAGCGGATT AGCTGTCACA 
GTAGCAAGCT ATTTAACCCC AGCAGGCAGA GATATACAAA ACCTTGGCAT AGAACCAGAT 
CGATATTTAG AAGCGCCTGA ACCTCTAAAT CCTGGCAGTA ATGAAGATAG ATGGTTGCAA 
GATGCAGAGC TATTTATGGA GGCATTGCTA GACCGTGAAG AAGAAGAAGA AGAACCAATC 
CAAACAAATG ATATAAATCC TGAAGAAAAG ATGATAGAAA CAAACACCTA A

Protein sequence

MPSTVKTLSK FLHKILCAFL SFCMIFLVTA RPLYALSDGQ QLVLEAWNIV NEGFLNQEKF 
NEVQWKRLRK KALEEEITTS TEAYNAIEGM LAPLGDPYTR LLRPKDYAAM KESNLGSEIN 
GVGLQLGARN IDGKIVVICP LEDSPAADAE ILSGSILIKV DNESPQSLGL EATAAKLRGE 
SGSKVIIELE TPDGEQKEIN LERRSVDLRP VRSKRIRNEL HTLGYLRITQ FSEGVPDQVR 
EALAELKEKG VEGLILDLRN NSGGLVSSGL AVADAFLSNQ PVVETKNRNE ISEPIPSNEG 
TFYDGPMVTL VNAGTASASE ILAGALQDNS RSELVGGKTF GKGLIQTLTN LSDGSGLAVT 
VASYLTPAGR DIQNLGIEPD RYLEAPEPLN PGSNEDRWLQ DAELFMEALL DREEEEEEPI 
QTNDINPEEK MIETNT