Gene P9301_07301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_07301
Symbol
ID	4912537
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	+
Start bp	649869
End bp	651203
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	30%
IMG OID	640160312
Product	carboxyl-terminal processing protease
Protein accession	YP_001090954
Protein GI	126696068
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAGATAA GAAAATTGCT TAAAAAAAAA TTTATATTTC TGTTTGCGAC ATCCTTTTCT 
GGACTATTCT TAAATAGTTT TGCAGAGGCA ACAGTTTTAA ATAATAGTTA TAAAGAAGTA 
ATTGATCATG TTTGGCAAAT TGTATATAGA GATTTTCTTG ATTCAAGCGG CAAATTTCAA 
AAGTCCAATT GGATTAATCT GAGAAAAGAA GTTTTATCAA AAACATATTC AGATAGCAAT 
GAAGCATATG ATGCGATTAG AGATATGCTT TCTAACTTAG ATGATTCTTA TACAAGATTT 
TTAGAACCTA AGGAATTTAA TCAAATGAGA ATCGATACCT CTGGTGAATT AACTGGAGTT 
GGTATCCAAA TAGTTAAAGA TAAAGAATCT GATGATTTAA TAATTATTTC TCCCATAGAG 
GGCACCCCTG CCTTTGATGC TGGAATTAAA GCTAGAGATA AAATATTATC CATAGATGAT 
ATTTCTACTG AAGGTATGAA TATTGAGGAG GCCGTGAAAT TAATAAGGGG GCAAAGAGGT 
ACTAAAGTAA AGCTTGAAAT TCTTAGAGGT TCTCAATCCT TTTTTAAGAC TTTATCGAGA 
GAAAAAATTG AAATAAAATC TGTATCAAGT AAAGTCAATC AAACCAAAAA TGGCTTATTA 
ATTGGCTATG TAAGAATTAA ACAATTTAAT GCAAATGCAT CAAAAGAAAC TAGAGATGCT 
ATTAAGGATT TAGAAACAAA AAAAGTCGCA GGATATGTTC TTGACTTGAG AAGTAATCCA 
GGAGGTTTAT TAGAATCAAG CATTGATATC TCAAGGCACT TTATTAACAA AGGAGTAATA 
GTTAGTACAG TAAGTAAAGA TGGTTTAAAA GAAACAAAAA AAGGAAACGG ACAAGCTCTA 
ACTAAAAAAC CCCTAGTTGT ACTGGTTAAT GAGGGTTCTG CTAGTGCTAG TGAAATAGTT 
TCTGGTGCAA TAAAAGATAA TAAAAGAGGA AAATTAGTTG GAAAAAAAAC GTTTGGTAAA 
GGTCTAGTTC AATCTATGAG GACATTAGTT GATGGTTCAG GATTAACTGT TACAGTCGCC 
AAGTATTTAA CTCCGAACGG TACTGATATA AACAAATCTG GAATTATTCC AGATATAGAT 
GTAAAAATGA ATATCAACCC TATTCTCCAA AGAGAGATTG GAACTAGAAA AGATAAACAA 
TATAGAGCTG GTGAAAAAGA GCTAATAAAT ATAATTAATA GAAAGAATCA GATAAGCGAA 
TTTAAGCCCG ACACTGCAAA CCTTAATGCT TTCCTAAAAA TTAATAAGGA AAATAAAATA 
TTTTTATTAA ATTAA

Protein sequence

MKIRKLLKKK FIFLFATSFS GLFLNSFAEA TVLNNSYKEV IDHVWQIVYR DFLDSSGKFQ 
KSNWINLRKE VLSKTYSDSN EAYDAIRDML SNLDDSYTRF LEPKEFNQMR IDTSGELTGV 
GIQIVKDKES DDLIIISPIE GTPAFDAGIK ARDKILSIDD ISTEGMNIEE AVKLIRGQRG 
TKVKLEILRG SQSFFKTLSR EKIEIKSVSS KVNQTKNGLL IGYVRIKQFN ANASKETRDA 
IKDLETKKVA GYVLDLRSNP GGLLESSIDI SRHFINKGVI VSTVSKDGLK ETKKGNGQAL 
TKKPLVVLVN EGSASASEIV SGAIKDNKRG KLVGKKTFGK GLVQSMRTLV DGSGLTVTVA 
KYLTPNGTDI NKSGIIPDID VKMNINPILQ REIGTRKDKQ YRAGEKELIN IINRKNQISE 
FKPDTANLNA FLKINKENKI FLLN