Gene P9211_10171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_10171
Symbol
ID	5730946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	909588
End bp	910841
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	39%
IMG OID	641285384
Product	Zn-dependent peptidase
Protein accession	YP_001550902
Protein GI	159903558
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.109713
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCAAGACC TGAAGATAAA TCGATTGGCA CTTAGAAGTG GTGCGGAATG TATTTCAACA 
TCAATGCCAG AATCTGCACT TACCTGCATT GACCTTTGGT GCAAGGCCGG AAGTTCCTTT 
GAAGACAGTG ACGAGAAAGG AATGGCTCAT TTTCTTGAAC ATATGATTTT CAAAGGAAGC 
AGCAAGTTAC GAGAAGGTGA ATTTGATTTA AAGATTGAAG CCCTTGGCGG CAGCAGTAAT 
GCTGCGACAG GTTTTGATGA CGTACATTTT TATGTATTAG TACCTTCAGA AGGTGTCGAG 
CAAGCAATTA AGTTATTAAT CGAACTTGTC CTATGTCCAA GCATTATGAA AAATGCATAT 
TCATTGGAGC GTGAAGTTGT ACTCGAAGAA ATAGCTCAAC AAAGTGATCA ACCTGACGAG 
AAAGTGTTTC AGATGGTTCT GGAAGGTTGT TGGAGCAACC ATCCATATGG GAAATCAATT 
CTAGGCAATG CATCAAGCCT TAACGCATCG ACTCCGAATC GAATGAAGTT GTTCCATCAA 
AGGCTATATA AACCAGAGAA TTGTGTCCTA TCAATCGCTG GGAAGTCCCC GAGAAATTTA 
TTAAAAATAT TGAGCGAAGG TGAACTTGGC AAACAAGTTG ATAAATCAAA TCCCAACAAT 
TCAAAACCAA ACTCAAAAAA ACTCAACTTT AATATTGGTC GAAAGATAGT AGAGGTTAAA 
AGACTTGAGT CAGCGAGATT AGTTATGGCA TGGCCAGTAC CTCCTGCTTC TGAACAGTTC 
ATAATAATGG GGTATGACAT AGCGACTACT CTTCTAGGAG AAGGTAGACG TAGTAGACTT 
GTTAATAATT TGCGAGAGGA ACAACAAATA GTCGAATCAA TTGAAATGGA CCTAACTGCA 
CTTGAACAGG GAGGCCTTGT ATTGCTAGAA GCGTGTTGCA TAGAAAAAAA TCTCAACAAA 
GTAGAAGATT CGATTAATCA AATTCTCATA GAAAGTATTA ATAGTCCTCC TAGCGAACGA 
GAAACAAAAC GTGCCAAAGA ATTAGTTAGA AATGGATTTT GCTTCAGCCT TGAACATCCA 
GCACAGGTTG CAGCAATTAC AGGTACACAA ACACTTTGGA ACCGTCATCA GCCACTGCTT 
GAACCTTTAA AGGATATAGA TGGCTGGTCA AGTTCTATGA TCCAAGAAGA AATATTTAGT 
TGTTTGCAGC CAAGCCAATG CTTCACTTTA ATTGCAAAAC CTCTTAGTAG TTGA

Protein sequence

MQDLKINRLA LRSGAECIST SMPESALTCI DLWCKAGSSF EDSDEKGMAH FLEHMIFKGS 
SKLREGEFDL KIEALGGSSN AATGFDDVHF YVLVPSEGVE QAIKLLIELV LCPSIMKNAY 
SLEREVVLEE IAQQSDQPDE KVFQMVLEGC WSNHPYGKSI LGNASSLNAS TPNRMKLFHQ 
RLYKPENCVL SIAGKSPRNL LKILSEGELG KQVDKSNPNN SKPNSKKLNF NIGRKIVEVK 
RLESARLVMA WPVPPASEQF IIMGYDIATT LLGEGRRSRL VNNLREEQQI VESIEMDLTA 
LEQGGLVLLE ACCIEKNLNK VEDSINQILI ESINSPPSER ETKRAKELVR NGFCFSLEHP 
AQVAAITGTQ TLWNRHQPLL EPLKDIDGWS SSMIQEEIFS CLQPSQCFTL IAKPLSS