Gene EcHS_A0178 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0178
Symbol	rseP
ID	5594330
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	194703
End bp	196055
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	51%
IMG OID	640919365
Product	zinc metallopeptidase RseP
Protein accession	YP_001456959
Protein GI	157159641
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0750] Predicted membrane-associated Zn-dependent proteases 1
TIGRFAM ID	[TIGR00054] RIP metalloprotease RseP

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00000000111428
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGAGTT TTCTCTGGGA TTTGGCTTCG TTCATCGTTG CACTGGGTGT ACTTATCACC 
GTGCATGAAT TTGGTCATTT CTGGGTTGCC CGGCGTTGTG GTGTTCGCGT TGAGCGTTTC 
TCAATAGGGT TTGGTAAGGC GCTCTGGCGG CGAACTGATA AGCTCGGCAC CGAATATGTT 
ATCGCCCTGA TCCCGCTGGG CGGTTATGTC AAAATGCTGG ATGAGCGCGC AGAACCGGTC 
GTTCCGGAAC TCCGCCACCA TGCCTTCAAT AATAAATCTG TTGGCCAACG AGCGGCGATT 
ATTGCCGCAG GTCCGGTTGC AAACTTCATT TTTGCTATCT TAGCCTACTG GCTGGTTTTT 
ATTATTGGTG TGCCTGGCGT ACGTCCGGTG GTTGGTGAAA TAGCAGCCAA TTCGATAGCT 
GCGGAAGCAC AAATTGCACC AGGTACGGAA CTAAAAGCCG TAGATGGTAT CGAAACGCCT 
GATTGGGATG CCGTGCGTTT GCAGTTGGTC GATAAAATTG GCGATGAAAG CACCACCATT 
ACAGTAGCGC CATTTGGCAG CGACCAACGG CGGGATGTAA AGCTCGATTT ACGTCACTGG 
GCGTTTGAGC CTGATAAAGA AGATCCGGTA TCTTCGCTGG GGATTCGTCC TCGTGGGCCG 
CAAATTGAAC CTGTACTGGA AAATGTGCAG CCAAACTCGG CGGCAAGCAA GGCAGGTTTG 
CAAGCAGGCG ACAGGATCGT TAAAGTCGAT GGTCAGCCCT TAACGCAGTG GGTGACCTTT 
GTGATGCTTG TCCGGGATAA CCCGGGTAAA TCCTTAGCGT TAGAAATCGA AAGGCAGGGG 
AGTCCCTTGT CTTTGACATT AATCCCGGAG AGTAAACCGG GTAATGGTAA AGCGATTGGT 
TTTGTCGGTA TTGAGCCGAA AGTCATTCCT TTGCCAGATG AGTATAAAGT TGTACGCCAG 
TATGGGCCGT TCAACGCCAT CGTCGAAGCC ACGGACAAAA CGTGGCAGCT GATGAAGCTG 
ACGGTCAGTA TGCTGGGAAA ATTGATCACC GGTGATGTGA AACTGAACAA CCTCAGTGGG 
CCGATCTCTA TCGCCAAGGG GGCTGGGATG ACAGCGGAAC TCGGGGTAGT TTATTACCTG 
CCGTTTCTTG CGCTTATTAG CGTGAACTTA GGGATAATTA ACCTGTTTCC GTTGCCCGTA 
CTTGACGGGG GGCATCTGCT GTTCCTTGCG ATCGAAAAGA TCAAGGGCGG ACCGGTATCC 
GAGCGGGTTC AAGACTTTTG TTATCGCATT GGCTCGATTC TGCTGGTGCT GTTAATGGGG 
CTTGCACTTT TCAATGATTT CTCTCGGTTA TGA

Protein sequence

MLSFLWDLAS FIVALGVLIT VHEFGHFWVA RRCGVRVERF SIGFGKALWR RTDKLGTEYV 
IALIPLGGYV KMLDERAEPV VPELRHHAFN NKSVGQRAAI IAAGPVANFI FAILAYWLVF 
IIGVPGVRPV VGEIAANSIA AEAQIAPGTE LKAVDGIETP DWDAVRLQLV DKIGDESTTI 
TVAPFGSDQR RDVKLDLRHW AFEPDKEDPV SSLGIRPRGP QIEPVLENVQ PNSAASKAGL 
QAGDRIVKVD GQPLTQWVTF VMLVRDNPGK SLALEIERQG SPLSLTLIPE SKPGNGKAIG 
FVGIEPKVIP LPDEYKVVRQ YGPFNAIVEA TDKTWQLMKL TVSMLGKLIT GDVKLNNLSG 
PISIAKGAGM TAELGVVYYL PFLALISVNL GIINLFPLPV LDGGHLLFLA IEKIKGGPVS 
ERVQDFCYRI GSILLVLLMG LALFNDFSRL