Gene A9601_03481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_03481
Symbol
ID	4717037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	318414
End bp	319709
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	36%
IMG OID	640078052
Product	carboxyl-terminal protease
Protein accession	YP_001008743
Protein GI	123967885
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTCAT CTTTTAACAA ACTTTTAACA TTCAAAAATT TGATCACTGC ATCAATGATC 
ATCGTTTTTT CTATCAATCT TTTGTTGATG GAAAGAGTGG ATGCTCTCAG TGATAGCAGG 
CAATTAGTAC TTGATGCTTG GACCTTGGTA AACGAAGGTT TTTATGATCC AGAAAAGTTT 
GATGAAATCC AATGGAAAAG AATTAGACAA AAAACATTAC AGAAACAAAT TGAAACAAGT 
GAAGAGGCTT ATTCCGCAAT TGAAGACATG TTAAGACCTC TAGACGATCC CTACACGAGA 
GTTTTACGCC CCAAAGATTA TGAGCTACTG AAATCAAGTA ATTTTGGGAG TGAAATTAAT 
GGTGTTGGGC TTCAATTAGG TGAAGATGAC AACAATAAAG TTAAAGTTAT TTCTACTCTT 
GGGGGGTCGC CAGCTGAAGA AGCTGGAATA GTAAGCGGGG ACATTATCGA GACAGTTGAT 
GGAATCTCAT CAGAAAAATT AGGGCTTGCA AGTACTGCCT CTAAGTTAAG AGGTGAGTCA 
GGGACAAAAG TTTTAGTTGA ATTATCTACG GAATCAGGAG AAATTAGGGA AGTCGATTTA 
GAGAGGAGAT CAGTAGATCT CAGACCAGTT AGAACAAAAA GATTAAGAGA CGATTCTCAC 
ACAATAGGAT ATTTAAGAAT AACTCAATTT AGCGAAAGCG TACCCAAAAA AGTTGAAGAG 
GCTCTTCAAG AGTTAAAAGA GAAAGAGGTT GAGGGCTTAA TCTTGGATCT TAGAAATAAT 
TCAGGGGGAC TAGTAAGCTC AGGTATTGCA GTTGCAGACA CATTATTGAG TGAGAAACCC 
GTAGTCGAGA CAAAAGATAG AAATGGAATC AAAGATGCAA TTATTTCTCA AAAAGAGACA 
TCTTTTGATG GACCAATGGT GACTTTAGTA AATAAAGGCA CTGCAAGTGC CAGTGAAATA 
CTTGCTGGTT CTTTAAAAGA TAATGAGAGG TCAATTCTTA TGGGAGAACA AACTTATGGT 
AAAGGTTTAA TTCAATCCCT AAAAAGTTTG GGAGAAGATA GTGGTATTGC TATAACAGTG 
GCTAGTTACT TAACACCAGA TGGTAATAAT ATACAAGGCC AGGGTATAAC ACCTGACAAA 
TTACTTGAAC TACCGGAAGC CAGTGATTTT GGAAGTACTG ACGATAAATG GGTAAGGAAT 
GCGGAATTAT TATTAGGGTC GCTTCTAGAA AAAGAAGAAG TTCCAGTTCA AACAATTGAT 
TTAAACAATG AAGAAATCAA ATCTTTAAAT GGCTAA

Protein sequence

MNSSFNKLLT FKNLITASMI IVFSINLLLM ERVDALSDSR QLVLDAWTLV NEGFYDPEKF 
DEIQWKRIRQ KTLQKQIETS EEAYSAIEDM LRPLDDPYTR VLRPKDYELL KSSNFGSEIN 
GVGLQLGEDD NNKVKVISTL GGSPAEEAGI VSGDIIETVD GISSEKLGLA STASKLRGES 
GTKVLVELST ESGEIREVDL ERRSVDLRPV RTKRLRDDSH TIGYLRITQF SESVPKKVEE 
ALQELKEKEV EGLILDLRNN SGGLVSSGIA VADTLLSEKP VVETKDRNGI KDAIISQKET 
SFDGPMVTLV NKGTASASEI LAGSLKDNER SILMGEQTYG KGLIQSLKSL GEDSGIAITV 
ASYLTPDGNN IQGQGITPDK LLELPEASDF GSTDDKWVRN AELLLGSLLE KEEVPVQTID 
LNNEEIKSLN G