Gene SbBS512_E2361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2361
Symbol
ID	6270636
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	2148808
End bp	2150568
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	52%
IMG OID	641726365
Product	peptidase, S16 (lon protease) family
Protein accession	YP_001880847
Protein GI	187732130
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1067] Predicted ATP-dependent protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000000251656
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGACCATTA CGAAACTTGC ATGGCGTGAC CTGGTTCCTG ATACCGATAG CTATCAGGAA 
ATATTTGCTC AGCCACATTT GATTGACGAA AACGATCCTT TATTCAGTGA TACTCAACCG 
CGGCTGCAAT TTGCGCTGGA GCAGTTGCTG CATACGCGAG CATCCTCCTC TTTTATGCTG 
GCTAAGGCCC CGGAAGAGTC TGAGTATCTG AATCTTATTG CCGATGCCGC GCGTACGCTA 
CAAAGCGATG CAGGCCAACT GGTGGGCGAT CACTATGAGG TTTCCGGCCA CTCCATCCGC 
TTACGTCACG CAGTGAGTGC AGATGATAAT TTTGCGACTT TAACGCAAGT TGTCGCTGCC 
GACTGGGTAG AAGCGGAGCA ACTCTTTGGC TGCCTGCGCC AGTTTAATGG CGACATTACC 
CTGCAGCCTG GTCTGGTGCA TCAGGCAAAT GGCGGTATTC TCATCATCTC TTTGCGTACA 
CTGCTGGCGC AACCTCTGCT GTGGATGCGG CTGAAAAATA TCGTTAACCG CGAGCGTTTT 
GACTGGGTTG CGTTTGATGA GTCGCGCCCT CTCCCCGTCT CTGTGCCTTC GATGCCATTG 
AAGCTGAAAG TCATTCTGGT AGGCGAACGC GAATCATTGG CTGATTTCCA GGAGATGGAG 
CCAGAGCTTT CAGAGCAGGC TATTTATAGC GAATTTGAAG ATACTCTGCA GATTGTCGAT 
GCGGAGTCAG TAAGCCAGTG GTGTCGCTGG GTGACATTTA CCGCCAGACA TAATCACTTA 
CCTGCCCCGG GAGCGGATGC CTGGCCGGTA CTTATCCGCG AAGCAGCACG CTACACCGGT 
GAACAAGAAA CACTTCCGCT TAGCCCGCAG TGGATCCTCC GCCAGTGTAA AGAGGTCGCC 
TCCCTGTGTG ATGGCGACAC CTTCTCCGGC GAGCAGCTAA ACTTAATGCT GCAGCAGCGT 
GAATGGCGCG AAGGTTTCCT CGCTGAACGT ATGCAGGATG AGATCCTTCA GGAGCAAATC 
CTGATTGAAA CCGAAGGCGA ACGCATCGGG CAAATTAACG CCCTTTCGGT CATTGAATTT 
CCGGGTCATC CACGCGCTTT TGGCGAACCT TCTCGCATTA GCTGCGTTGT GCATATTGGC 
GATGGTGAAT TCACCGACAT CGAACGCAAA GCGGAACTTG GCGGCAATAT CCATGCGAAA 
GGGATGATGA TCATGCAAGC GTTCCTGATG TCGGAACTAC AGCTTGAGCA ACAGATCCCC 
TTCTCAGCAT CGCTGACATT TGAGCAGTCA TACAGTGAAG TTGATGGAGA TAGTGCCTCG 
ATGGCTGAAC TCTGCGCCCT GATAAGCGCC CTCGCCGATG TGCCGGTGAA TCAGAGTATC 
GCTATCACAG GTTCAGTCGA TCAGTTCGGT CGCGCCCAGC CGGTCGGTGG TTTAAATGAG 
AAAATCGAAG GCTTCTTTGC TATTTGCCAG CAACGTGAGT TAACCGGGAA ACAAGGTGTC 
ATTATCCCCA CAGCTAACGT TCGCCATTTA AGTCTTCACA GTGAACTGGT GAAAGCGGTA 
GAAGAAGGCA AATTCACCAT CTGGGCAGTA GACGATGTGA CTGACGCACT GCCGTTATTA 
TTAAATCTGG TGTGGGATGG CGAAGGCCAA ACGACGCTGA TGCAAACCAT CCAGGAACGT 
ATCGCGCAAG CATCGCAACA GGAAGGACGT CACCGTTTTC CATGGCCATT ACGTTGGCTG 
AACTGGTTTA TTCCGAACTG A

Protein sequence

MTITKLAWRD LVPDTDSYQE IFAQPHLIDE NDPLFSDTQP RLQFALEQLL HTRASSSFML 
AKAPEESEYL NLIADAARTL QSDAGQLVGD HYEVSGHSIR LRHAVSADDN FATLTQVVAA 
DWVEAEQLFG CLRQFNGDIT LQPGLVHQAN GGILIISLRT LLAQPLLWMR LKNIVNRERF 
DWVAFDESRP LPVSVPSMPL KLKVILVGER ESLADFQEME PELSEQAIYS EFEDTLQIVD 
AESVSQWCRW VTFTARHNHL PAPGADAWPV LIREAARYTG EQETLPLSPQ WILRQCKEVA 
SLCDGDTFSG EQLNLMLQQR EWREGFLAER MQDEILQEQI LIETEGERIG QINALSVIEF 
PGHPRAFGEP SRISCVVHIG DGEFTDIERK AELGGNIHAK GMMIMQAFLM SELQLEQQIP 
FSASLTFEQS YSEVDGDSAS MAELCALISA LADVPVNQSI AITGSVDQFG RAQPVGGLNE 
KIEGFFAICQ QRELTGKQGV IIPTANVRHL SLHSELVKAV EEGKFTIWAV DDVTDALPLL 
LNLVWDGEGQ TTLMQTIQER IAQASQQEGR HRFPWPLRWL NWFIPN