Gene SbBS512_E4849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4849
Symbol	pmbA
ID	6268565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	4520431
End bp	4521771
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	54%
IMG OID	641728587
Product	peptidase PmbA
Protein accession	YP_001882981
Protein GI	187733964
COG category	[R] General function prediction only
COG ID	[COG0312] Predicted Zn-dependent proteases and their inactivated homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTAA TCTCTCAAGT TGAAGCGCAG CGCAAGATTC TGGAAGAAGC AGTTTCCACT 
GCGCTGGAGT TGGCCTCAGG CAAATCGGAC GGTGCGGAAG TTGCCGTCAG CAAGACCACC 
GGCATTAGCG TAAGCACGCG TTATGGTGAA GTGGAGAATG TTGAATTCAA TAGCGATGGC 
GCGCTGGGGA TCACTGTTTA TCACCAGAAC CGCAAAGGTA GCGCATCATC CACCGATTTA 
AGCCCGCAGG CCATTGCCCG TACTGTACAG GCGGCGCTGG ATATTGCCCG TTATACCTCG 
CCAGATCCCT GTGCCGGCGT GGCAGACAAA GAGCTGCTGG CCTTTGACGC ACCAGATCTC 
GACTTGTTCC ACCCTGCGGA AGTTTCCCCG GATGAAGCCA TTGAACTGGC GGCCCGCGCA 
GAACAGGCGG CATTGCAGGC GGACAAACGC ATCACCAATA CCGAAGGTGG CAGCTTTAAC 
AGCCACTACG GTGTTAAAGT TTTTGGCAAC AGCCACGGCA TGTTGCAGGG TTACTGCTCA 
ACGCGTCATT CGCTCTCCAG CTGTGTAATT GCCGAAGAAA ATGGCGATAT GGAGCGTGAT 
TACGCCTACA CCATTGGTCG TGCGATGAGC GATCTGCAAA CGCCAGAGTG GGTTGGGGCC 
GACTGTGCTC GCCGTACTTT ATCGCGCCTG TCACCGCGTA AACTCTCCAC CATGAAAGCG 
CCGGTCATTT TTGCCAATGA AGTGGCAACC GGGCTTTTTG GCCATCTGGT GGGGGCGATA 
GCGGGTGGAT CGGTTTACCG TAAATCTACC TTCCTGCTGG ATTCGCTGGG TAAACAAATT 
CTGCCGGACT GGCTGACCAT TGAAGAGCAT CCGCATCTGC TGAAAGGGCT GGCGTCGACG 
CCATTCGACA GCGAAGGTGT GCGCACCGAG CGTCGCGATA TTATTAAAGA TGGCATCCTG 
ACTCAGTGGC TGCTGACCAG CTATTCGGCG CGAAAACTGG GGCTGAAAAG CACCGGACAT 
GCGGGCGGTA TTCACAACTG GCGGATTGCC GGACAAGGTC TAAGCTTCGA GCAGATGCTC 
AAAGAGATGG GCACCGGGCT GGTGGTGACG GAATTGATGG GCCAGGGCGT GAGTGCAATT 
ACCGGTGATT ATTCCCGTGG TGCGGCGGGC TTCTGGGTAG AAAACGGCGA AATTCAGTAT 
CCGGTTAGCG AAATCACCAT CGCAGGTAAT TTAAAAGATA TGTGGCGCAA TATTGTCACC 
GTCGGTAACG ATATTGAAAC ACGCAGTAAT ATACAGTGTG GTTCTGTGCT GTTGCCGGAG 
ATGAAAATCG CCGGACAGTA A

Protein sequence

MKVISQVEAQ RKILEEAVST ALELASGKSD GAEVAVSKTT GISVSTRYGE VENVEFNSDG 
ALGITVYHQN RKGSASSTDL SPQAIARTVQ AALDIARYTS PDPCAGVADK ELLAFDAPDL 
DLFHPAEVSP DEAIELAARA EQAALQADKR ITNTEGGSFN SHYGVKVFGN SHGMLQGYCS 
TRHSLSSCVI AEENGDMERD YAYTIGRAMS DLQTPEWVGA DCARRTLSRL SPRKLSTMKA 
PVIFANEVAT GLFGHLVGAI AGGSVYRKST FLLDSLGKQI LPDWLTIEEH PHLLKGLAST 
PFDSEGVRTE RRDIIKDGIL TQWLLTSYSA RKLGLKSTGH AGGIHNWRIA GQGLSFEQML 
KEMGTGLVVT ELMGQGVSAI TGDYSRGAAG FWVENGEIQY PVSEITIAGN LKDMWRNIVT 
VGNDIETRSN IQCGSVLLPE MKIAGQ