Gene SbBS512_E4153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4153
Symbol
ID	6270238
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	3878949
End bp	3880469
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	51%
IMG OID	641727980
Product	putative ATP-dependent protease
Protein accession	YP_001882407
Protein GI	187732126
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0606] Predicted ATPase with chaperone activity
TIGRFAM ID	[TIGR00368] Mg chelatase-related protein

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACTGT CAATTGTTCA TACCCGCGCA GCCCTGGGAG TAAATGCGCC CCCGATCACT 
GTTGAGGTAC ATATCAGTAA AGGTCTACCC GGCTTAACGA AGGTGGGCTT ACCAGAAACA 
ACGGTAAAAG AAGCTCGCGA TCGCGTGCGC AGCGCCATTA TCAATAGCGG ATATGAATAT 
CCGGCGAAAA AAATCACCAT CAACCTGGCT CCAGCTGATC TGCCAAAAGA AGGGGGACGA 
TATGATTTAC CTATCGCCAT TGCGTTGCTG GCGGCCTCAG AACAGCTTAC AGCCAATAAG 
TTAGATGAAT ATGGATTAGT CGGAGAACTG GCGCTTACAG GCGCTCTGCG TGGCGTTCCC 
GGCGCAATCT CCAGTACAAC TGAAGCTATT AAGTCGGGCA GAAAAATTAT CGTCGCGAAA 
GATAACGAAG ATGAAGTGGA GCTAATTAAC GGTGAAGGAT GCCTGATAGC CGATCATCTG 
CAAGCTGTCT GTGCGTTTCT GGAAGGTAAG CACGCTCTCG AACGCCCGAA ACCAACTGAT 
GCAGTATCCC GGGCGCTACA ACATGATCTC AGTGATGTTA TCGGTCAGGA ACAAGGAAAG 
CGAGGGCTGG AAATTACCGC CGCTGGCGGG CACAACCTTT TACTGATTGG GCCGCCGGGA 
ACAGGTAAAA CAATGCTCGC CAGCCGTATT AATGGCCTGT TACCAGATTT AAGCAATGAA 
GAGGCACTGG AGAGTGCTGC GATATTAAGT CTGGTAAATG CTGAATCAGT ACAAAAACAA 
TGGCGGCAGC GCCCGTTCCG CTCACCTCAT CACAGTGCAT CGTTAACTGC GATGGTAGGC 
GGTGGCGCAA TTCCAGGGCG CGGTGAAATT TCGCTGGCGC ATAACGGCGT GCTTTTTCTT 
GATGAGTTAC CTGAATTTGA AAGGCGTACA CTGGATGCCT TGCGAGAGCC GATTGAATCC 
GGGCAGATCC ATCTTTCACG CACGCGAGCA AAAATAACCT ATCCAGCCCG TTTCCAGCTT 
GTCGCGGCGA TGAATCCCAG CCCTACCGGA CATTATCAGG GAAACCATAA CCGCTGCACA 
CCAGAGCAAA CGCTGCGTTA TCTCAACCGA CTCTCTGGTC CCTTTCTCGA CCGCTTCGAT 
CTCTCACTGG AGATCCCATT ACCGCCTCCC CGTATTTTGA GTAAAGCGGT AGTGCCGGGA 
GAAAGCAGCG CCACCGTTAA ACAACGCGTA ATGGCCGCCA GAGAGCGCCA ATTTAAGCGG 
CAGAATAAAC TGAACGCCTG GCTGGATAGT CCGGAAATAC GCCAATTCTG CAAACTTGAG 
AGCGAAGATG CGATGTGGCT GGAAGAAACG CTGATCCATC TGGGGTTATC GATTCGTGCC 
TGGCAGCGGT TATTGAAAGT TGCACGAACC ATTGCTGATA TTGATCAGTT TGACATTATC 
ACACGTCAAC ATTTGCAGGA GGCAGTTAGC TATCGAGCGA TTGACCGTTT GCTCATCCAT 
CTGCAGAAAC TACTGACATA A

Protein sequence

MSLSIVHTRA ALGVNAPPIT VEVHISKGLP GLTKVGLPET TVKEARDRVR SAIINSGYEY 
PAKKITINLA PADLPKEGGR YDLPIAIALL AASEQLTANK LDEYGLVGEL ALTGALRGVP 
GAISSTTEAI KSGRKIIVAK DNEDEVELIN GEGCLIADHL QAVCAFLEGK HALERPKPTD 
AVSRALQHDL SDVIGQEQGK RGLEITAAGG HNLLLIGPPG TGKTMLASRI NGLLPDLSNE 
EALESAAILS LVNAESVQKQ WRQRPFRSPH HSASLTAMVG GGAIPGRGEI SLAHNGVLFL 
DELPEFERRT LDALREPIES GQIHLSRTRA KITYPARFQL VAAMNPSPTG HYQGNHNRCT 
PEQTLRYLNR LSGPFLDRFD LSLEIPLPPP RILSKAVVPG ESSATVKQRV MAARERQFKR 
QNKLNAWLDS PEIRQFCKLE SEDAMWLEET LIHLGLSIRA WQRLLKVART IADIDQFDII 
TRQHLQEAVS YRAIDRLLIH LQKLLT