Gene EcSMS35_0187 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0187
Symbol	rseP
ID	6146793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	205728
End bp	207080
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	51%
IMG OID	641615088
Product	zinc metallopeptidase RseP
Protein accession	YP_001742304
Protein GI	170683080
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0750] Predicted membrane-associated Zn-dependent proteases 1
TIGRFAM ID	[TIGR00054] RIP metalloprotease RseP

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000756829
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAGTT TTCTCTGGGA TTTGGCTTCG TTCATCGTTG CACTGGGTGT ACTTATCACC 
GTGCATGAAT TTGGTCATTT CTGGGTTGCC CGGCGTTGTG GTGTTCGCGT TGAGCGTTTC 
TCAATAGGGT TTGGTAAGGC GCTCTGGCGG CGAACTGATA AGCTCGGCAC CGAATATGTT 
ATCGCCCTGA TCCCGTTGGG CGGTTATGTC AAAATGCTGG ATGAGCGCGC AGAACCGGTC 
GTTCCGGAAC TCCGCCACCA TGCCTTCAAT AATAAATCTG TCGGCCAACG AGCGGCGATT 
ATTGCCGCAG GTCCGGTTGC AAACTTCATT TTTGCTATCT TTGCCTACTG GCTGGTTTTT 
ATTATTGGTG TGCCTGGCGT ACGTCCGGTG GTTGGTGAAA TAGCAGCCAA TTCGATAGCT 
GCGGAAGCAC AAATTGCACC AGGTACGGAA CTAAAAGCCG TAGATGGTAT CGAAACGCCT 
GATTGGGATG CCGTGCGTTT GCAGTTGGTC GATAAAATTG GCGATGAAAG CACCACCATT 
ACGGTAGCGC CATTTGGCAG CGACCAACGG CGGGATGTAA AGCTCGATTT ACGTCACTGG 
GCGTTTGAGC CTGATAAAGA AGATCCGGTA ACTTCGCTGG GGATTCGTCC TCGTGGGCCG 
CAAATTGAAC CTGTACTGGA AAATGTGCAG CCAAACTCGG CGGCAAGCAA GGCAGGTTTG 
CAAGCAGGCG ACAGGATCGT TAAAGTCGAT GGTCAGCCCT TAACGCAGTG GGTGACCTTT 
GTGATGCTTG TCCGGGATAA CCCGGGTAAA TCCTTAGCGT TAGAAATCGA AAGGCAGGGG 
AGTCCTTTGT CTTTGACATT AATCCCGGAG AGTAAACCGG GTAATGGTAA AGCGATTGGT 
TTTGTCGGTA TTGAGCCGAA AGTCATTCCT TTGCCAGATG AGTATAAAGT TGTACGCCAG 
TATGGGCCGT TCAACGCCAT TGTCGAAGCC ACGGACAAAA CGTGGCAGCT GATGAAGCTG 
ACGGTCAGTA TGCTGGGAAA ATTGATCACC GGTGATGTGA AACTGAACAA CCTCAGTGGG 
CCGATCTCTA TCGCCAAGGG GGCTGGGATG ACAGCGGAAC TCGGGGTTGT TTATTACCTG 
CCGTTTCTTG CGCTTATTAG CGTGAACTTA GGGATAATTA ACCTGTTTCC GTTGCCCGTA 
CTTGACGGGG GGCATCTGCT GTTCCTTGCG ATCGAAAAGA TCAAGGGCGG ACCGGTATCC 
GAGCGGGTTC AAGACTTTTG TTATCGCATT GGCTCGATTC TGCTGGTGCT GTTAATGGGG 
CTTGCACTTT TCAATGATTT CTCTCGGTTA TGA

Protein sequence

MLSFLWDLAS FIVALGVLIT VHEFGHFWVA RRCGVRVERF SIGFGKALWR RTDKLGTEYV 
IALIPLGGYV KMLDERAEPV VPELRHHAFN NKSVGQRAAI IAAGPVANFI FAIFAYWLVF 
IIGVPGVRPV VGEIAANSIA AEAQIAPGTE LKAVDGIETP DWDAVRLQLV DKIGDESTTI 
TVAPFGSDQR RDVKLDLRHW AFEPDKEDPV TSLGIRPRGP QIEPVLENVQ PNSAASKAGL 
QAGDRIVKVD GQPLTQWVTF VMLVRDNPGK SLALEIERQG SPLSLTLIPE SKPGNGKAIG 
FVGIEPKVIP LPDEYKVVRQ YGPFNAIVEA TDKTWQLMKL TVSMLGKLIT GDVKLNNLSG 
PISIAKGAGM TAELGVVYYL PFLALISVNL GIINLFPLPV LDGGHLLFLA IEKIKGGPVS 
ERVQDFCYRI GSILLVLLMG LALFNDFSRL