Gene P9303_21861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_21861
Symbol
ID	4777800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	1943725
End bp	1945065
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	56%
IMG OID	640087701
Product	carboxyl-terminal protease
Protein accession	YP_001018186
Protein GI	124023879
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.43703
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCCAA TGTTGCCGAC TACTAACTCC CGATCACATC CGCTGCGGCG CCTATGGCTT 
GCGTGGCTGA GCCTGGGTCT TGGCGTGCTG CTGATGGCGA CTCCAGCCAT GGCATTGAAT 
GATGCCCAAC AACTGGTCGT TGAAAGCTGG CGGCTCGTCA ACCAGGGATA TCTAGACCCA 
GCCAAGTTCG ATCAGGTGCA CTGGCGAAGG CTAAGAGAGC AGGCATTAGA GAAAACAATC 
AACAGTAGTA ACGATGCCTA TGAGGCCATC GAAGCGATGC TGCTTCCACT TGAAGATCCC 
TACACAAGAC TATTGAGACC AGACGACTAC ACCGCCATAA AAGCCGCCAA TTTGGGCAGC 
GAGATCAACG GCGTTGGTCT ACAGCTGGGG GCCCGCGCTG AAGATGGCCA GGTCGTGGTT 
ATCGCTCCGC TTGAAGGATC TCCCGCGGCC GATGCGGGCG TCACAAGCGG CACGGCCCTA 
CTCAGCGTGG ATGGCCAGTC TCCACAAGCC CTTGGACTCG AAGCCACAGC TGCAAGGCTG 
CGAGGAGAAG TGGGCTCACA AGTTGTAGTA AAACTGCAAC CCCCAAATGG ATCTAGCGAA 
GAACTCACCC TCGAGCGACG CAGTGTGGAC CTCAGGCCAG TACGGACCCG CCGACTGAGG 
AGTGCTAAAC ACACCCTGGG CTACCTACGC ATCACCCAGT TCAGCGAAGG AGTGCCCGAA 
CAGGTCAAAG AAGCACTTCA GGAACTGTCA GAAAAAGAGA TTGAAGGCCT AGTTCTAGAT 
CTGCGCAATA ACTCCGGTGG GTTAGTGAGC TCCGGACTAG CTGTAGCGGA TGCCTTCCTG 
AGTGGCTCCC CAATCGTGGA GACACGCAAC CGAGAGCGCA TTAACGAAGC AATCCCTTCT 
GCAATTGAAA CCCTTTATGA CGGTCCGATG GTGACACTGG TCAACGGCGG GACTGCCAGC 
GCGAGCGAAA TTCTGGCTGG TGCCCTCCAA GACAACAGCC GCTCACAGCT GCTTGGCAGC 
CGCACGTTTG GCAAGGGTCT GATCCAAACA CTCACCAACC TGAGCGACGG CAGTGGCCTG 
GCCGTGACGG TAGCCGGATA CATGACTCCA AGCGGCCGAG ACATTCAAAA CCAGGGCATC 
GAGCCGGATC GGATTCTGGA TCCTCCTGAA CCCCTCAATC CTGGAGGGGA AGAAGACCGT 
TGGTTGCATG ATGCTGAACT CTGGATGGAG GCCCAAATCG ACCGCGATCA GGATGCCCAG 
TTAGAGACCA CAGAAGATCT TCAGCTCGAT AGTGCTGAAG ATGTTGAATT CAAAACTGAG 
CAGAATCGTG ATGATCCATG A

Protein sequence

MKPMLPTTNS RSHPLRRLWL AWLSLGLGVL LMATPAMALN DAQQLVVESW RLVNQGYLDP 
AKFDQVHWRR LREQALEKTI NSSNDAYEAI EAMLLPLEDP YTRLLRPDDY TAIKAANLGS 
EINGVGLQLG ARAEDGQVVV IAPLEGSPAA DAGVTSGTAL LSVDGQSPQA LGLEATAARL 
RGEVGSQVVV KLQPPNGSSE ELTLERRSVD LRPVRTRRLR SAKHTLGYLR ITQFSEGVPE 
QVKEALQELS EKEIEGLVLD LRNNSGGLVS SGLAVADAFL SGSPIVETRN RERINEAIPS 
AIETLYDGPM VTLVNGGTAS ASEILAGALQ DNSRSQLLGS RTFGKGLIQT LTNLSDGSGL 
AVTVAGYMTP SGRDIQNQGI EPDRILDPPE PLNPGGEEDR WLHDAELWME AQIDRDQDAQ 
LETTEDLQLD SAEDVEFKTE QNRDDP